Моделирование кредитного скоринга на основе решающих деревьев

Целью данной работы является разработка алгоритма синтеза леса решений с высокой обобщающей способностью и исследование эффективности применения такой модели для разработки автоматизированной системы application-скоринга....

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Культура народов Причерноморья
Дата:2011
Автор: Дюличева, Ю.Ю.
Формат: Стаття
Мова:Російська
Опубліковано: Кримський науковий центр НАН України і МОН України 2011
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/55169
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Моделирование кредитного скоринга на основе решающих деревьев / Ю.Ю. Дюличева // Культура народов Причерноморья. — 2011. — № 197, Т. 1. — С. 50-51. — Бібліогр.: 4 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859470304163659776
author Дюличева, Ю.Ю.
author_facet Дюличева, Ю.Ю.
citation_txt Моделирование кредитного скоринга на основе решающих деревьев / Ю.Ю. Дюличева // Культура народов Причерноморья. — 2011. — № 197, Т. 1. — С. 50-51. — Бібліогр.: 4 назв. — рос.
collection DSpace DC
container_title Культура народов Причерноморья
description Целью данной работы является разработка алгоритма синтеза леса решений с высокой обобщающей способностью и исследование эффективности применения такой модели для разработки автоматизированной системы application-скоринга.
first_indexed 2025-11-24T07:42:07Z
format Article
fulltext Дюличева Ю.Ю. МОДЕЛИРОВАНИЕ КРЕДИТНОГО СКОРИНГА НА ОСНОВЕ РЕШАЮЩИХ ДЕРЕВЬЕВ 50 Дюличева Ю.Ю. УДК 519.7 МОДЕЛИРОВАНИЕ КРЕДИТНОГО СКОРИНГА НА ОСНОВЕ РЕШАЮЩИХ ДЕРЕВЬЕВ Разработка и внедрение автоматизированных систем оценки кредитоспособности заемщиков является актуальным и перспективным направлением для продвижения банков Украины на рынке потребительского кредитования. По данным Нацбанка Украины [1] «просроченная задолженность по кредитам, предоставленным физическим лицам за 9 месяцев 2006 года увеличилась на 94%, а темпы роста кредитования физических лиц выросли на 86,4%». С наступлением мирового финансового кризиса наблюдалось снижение числа кредитов и рост уровня невозврата кредитов. В современных условиях эффективная работа банка невозможна без внедрения автоматизированных скоринговых систем, оценивающих риск невозврата кредитов и вероятность мошенничества со стороны физических лиц. Перечислим основные типы современного скоринга [1]: application-скоринг ориентирован на оценку кредитоспособности заемщиков; collection-скоринг ориентирован на разработку комплекса мероприятий по работе с заемщиками, неспособными своевременно вернуть кредит до момента передачи таких заемщиков в коллекторское агенство; behavioral-скоринг ориентирован на исследование динамики кредитного счета заемщика; fraud-скоринг ориентирован на выявление мошенников среди потенциальных заемщиков. Application-скоринг и fraud-скоринг подразумевает разработку модели на основе технологий интеллектуального анализа данных Data Mining типа деревьев решений (леса решений), нейронных сетей, генетических алгоритмов, байесовских сетей и т.п., а также комбинирования этих моделей. В работе [2] обосновывалась эффективность применения логических алгоритмов и, в частности, лесов решений для оценки кредитоспособности заемщиков на основе кредитных историй. Целью данной работы является разработка алгоритма синтеза леса решений с высокой обобщающей способностью и исследование эффективности применения такой модели для разработки автоматизированной системы application-скоринга. Сложность переборной задачи построения решающего дерева (дерева решений) с минимальным числом листьев обосновывает существование целого класса алгоритмов синтеза деревьев и лесов решений. Любой алгоритм из этого класса направлен на поиск компромисса между сложностью структуры решающего дерева и точностью распознавания объектов. В работе [3] был предложен алгоритм синтеза леса решений, реализующий такой компромисс. Несмотря на высокую обобщающую способность модели, предложенной в работе автора [3], оставался открытым вопрос о подборе ранга ветвей каждого дерева решений. Рассмотрим модификацию алгоритма синтеза леса решений с определением ранга ветвей (числа внутренних вершин) на основе «голосования» критериев редукции деревьев решений. 1. BuildTree(di) 2. For each vertex v from di { estimation1(v) = ComputePEP(v); estimation2(v) = ComputeCCP(v); estimation3(v) = ComputeMEP(v); } 3. For each vertex v from di { v_pruning = majority_vote(estimation1(v),estimation2(v),estimation3(v)); } 4. PruningTree(di) 5. Rejection_set(∩di), priority_vector (∩di) 6. if (Rejection_set(∩di)  Ø) { i++; goto 1; } Процедура BuildTree(di) реализует построение решающего дерева с помощью энтропийного критерия, процедуры ComputePEP(v), ComputeCCP(v), ComputeMEP(v) реализуют стратегию редукции: - критерий PEP [4] основан на сравнении числа ошибок в вершине v и числа ошибок в поддереве T(v) c учетом стандартной ошибки для поддерева, вычисленной в предположении биномиального распределения ошибок )))((())(()( vTerrorSEvTerrorverror  , (1) где   21 )()))(()(())(()))((( vnvTerrorvnvTerrorvTerrorSE  , n(v) – число обучающих объектов в вершине v. - критерий CCP [4] основан на редукции поддеревьев T(v) с наименьшей величиной  , вычисляемой по формуле 1))(( ))(()(    vT vTrvr   , (2) где r(v) – коэффициент ошибок в вершне v, r(T(v)) – коэффициент ошибок в поддереве с корнем v, ))(( vT - число листьев в поддереве с вершиной v. Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ 51 - критерий MEP [4] основан на вычислении коэффициента ожидаемой ошибки для случая обучающего множества с k классами по формуле kvn kvnvn E с k    )( 1)()( , (3) где n(v) – число обучающих объектов в вершине v, nc(v) – число обучающих объектов в вершине v, принадлежащих мажоритарному классу с. Каждой из этих процедур принимается решение о редукции (замене листом) поддерева (ветви) с корнем в вершине v. Критерии редукции PEP, ССP редуцирует дерево решений по направлению от листьев к корню, а MEP редуцирует дерево решений по направлению от корня к листьям, являясь по сути стратегией предредукции. Процедурой majority_vote (estimation1(v), estimation2(v), estimation3(v)) принимается решение о целесообразности отсечения поддерева с корнем v на основе процедуры «голосования» критериев редукции. Процедура PruningTree(di) реализует саму редукцию с последующим формированием области отказа Rejection_set(di) и вектора приоритетов priority_vector(di) признаков дерева di. В область отказа дерева попадают все объекты из обучающей выборки, которые попали в редуцированное поддерево с корнем v_pruning, в векторе приоритетов наивысшим приоритетом обладают признаки нулевого уровня всех деревьев леса решений, затем признаки первого уровня и т.д. Если совместная область отказа всех построенных деревьев леса решений (∩di) не пуста, имеет смысл строить следующее дерево решений. На основе предложенной модели синтеза леса решений с процедурой «голосования» критериев редукции было разработано «ядро» автоматизированной системы application-скоринга. Результаты моделирования апробированы на одной из выборок кредитных историй и представлены на рисунке 1. Измерение процента ошибок на контрольной выборке показало, что в 67 экспериментах из 80 модель леса решений на основе «голосования» критериев редукции не хуже модели леса решений с фиксированным рангом 7. Алгоритм синтеза леса решений с использованием процедуры голосования критериев редукции не гарантирует построение корректного (безошибочно распознающего все обучающие объекты) леса решений. В случае построения некорректного леса решений для классификации объектов могут быть использованы алгоритмы принятия решений на основе «голосования» деревьев решений леса. Рис.1. Эмпирическая оценка процента ошибок на контроле для леса решений ранга 7 и леса решений на основе процедуры голосования критериев редукции Таким образом, синтез лесов решений – это одно из перспективных направлений, связанных с увеличением обобщающей способности алгоритмов этого класса. Высокая точность лесов решений достигается за счет упрощения структуры отдельных деревьев, но при этом усложняется процесс синтеза самого леса решений. В дальнейшем представляет интерес изучение свойств лесов решений и исследование эффективности применения данной модели для оценки вероятности мошенничества заемщиков – fraud-scoring. Источники и литература: 1. Пищулин А. Внедрение кредитного скоринга как один из факторов эффективного управления процессом кредитования / А. Пищулин // Современные кредитные технологии : доклады III Междунар. Бизнес-Форума. – 2005. 2. Дюличева Ю. Ю. Об эффективности применения ансамблей решающих деревьев в задаче оценки кредитоспособности физических лиц / Ю. Ю. Дюличева // Ученые записки Таврического национального университета им. В.И. Вернадского. – Симферополь : Информ.-изд. отдел ТНУ. – С. 23- 28. – (Экономика). 3. Дюличева Ю. Ю. Модели коррекции редуцированных бинарных решающих деревьев : дис. … канд. ф.- м. наук по спец. 01.05.01 «Теоретические основы информатики и кибернетики» / Ю. Ю. Дюличева; Ин- т кибернетики им. В. М. Глушкова НАН Украины. – К., 2004. 4. Esposito F. A comparative analysis of methods for pruning decision trees / F. Esposito, D. Malerba, G. Seneraro // IEEE Transactions on Pattern Analysis and Machine Intelligence – 1997. – № 19 (5). – P. 476-491.
id nasplib_isofts_kiev_ua-123456789-55169
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1562-0808
language Russian
last_indexed 2025-11-24T07:42:07Z
publishDate 2011
publisher Кримський науковий центр НАН України і МОН України
record_format dspace
spelling Дюличева, Ю.Ю.
2014-02-06T12:05:34Z
2014-02-06T12:05:34Z
2011
Моделирование кредитного скоринга на основе решающих деревьев / Ю.Ю. Дюличева // Культура народов Причерноморья. — 2011. — № 197, Т. 1. — С. 50-51. — Бібліогр.: 4 назв. — рос.
1562-0808
https://nasplib.isofts.kiev.ua/handle/123456789/55169
519.7
Целью данной работы является разработка алгоритма синтеза леса решений с высокой обобщающей способностью и исследование эффективности применения такой модели для разработки автоматизированной системы application-скоринга.
ru
Кримський науковий центр НАН України і МОН України
Культура народов Причерноморья
Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
Моделирование кредитного скоринга на основе решающих деревьев
Моделювання кредитного скорінгу на основі розв’язуючих дерев
The modelling of credit scoring based on decision trees
Article
published earlier
spellingShingle Моделирование кредитного скоринга на основе решающих деревьев
Дюличева, Ю.Ю.
Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
title Моделирование кредитного скоринга на основе решающих деревьев
title_alt Моделювання кредитного скорінгу на основі розв’язуючих дерев
The modelling of credit scoring based on decision trees
title_full Моделирование кредитного скоринга на основе решающих деревьев
title_fullStr Моделирование кредитного скоринга на основе решающих деревьев
title_full_unstemmed Моделирование кредитного скоринга на основе решающих деревьев
title_short Моделирование кредитного скоринга на основе решающих деревьев
title_sort моделирование кредитного скоринга на основе решающих деревьев
topic Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
topic_facet Проблемы материальной культуры – ЭКОНОМИЧЕСКИЕ НАУКИ
url https://nasplib.isofts.kiev.ua/handle/123456789/55169
work_keys_str_mv AT dûličevaûû modelirovaniekreditnogoskoringanaosnoverešaûŝihderevʹev
AT dûličevaûû modelûvannâkreditnogoskoríngunaosnovírozvâzuûčihderev
AT dûličevaûû themodellingofcreditscoringbasedondecisiontrees