Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії

The decision support system was created for estimating and forecasting the state of an insurance company according to its financial and economic indicators. The task of estimating the state of this type of an institution was considered as a problem of a binary classification: whether the company’s a...

Повний опис

Збережено в:

Бібліографічні деталі
Дата:	2022
Автор:	Panibratov, Roman
Формат:	Стаття
Мова:	Українська
Опубліковано:	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2022
Теми:	страхова компанія система підтримання прийняття рішень бінарна класифікація метод k-найближчих сусідів метод опорних векторів наївний байєсівський класифікатор випадковий ліс градієнтний бустинг нейронні мережі
Онлайн доступ:	https://journal.iasa.kpi.ua/article/view/259157
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	System research and information technologies
Завантажити файл:

Репозитарії

System research and information technologies

_version_	1867334425030688768
author	Panibratov, Roman
author_facet	Panibratov, Roman
author_institution_txt_mv	[ { "author": "Roman Panibratov", "institution": "Навчально-науковий комплекс \"Інститут прикладного системного аналізу\" Національного технічного університету України \"Київський політехнічний інститут імені Ігоря Сікорського\", Київ" } ]
author_sort	Panibratov, Roman
baseUrl_str	http://journal.iasa.kpi.ua/oai
collection	OJS
datestamp_date	2022-06-21T10:27:50Z
description	The decision support system was created for estimating and forecasting the state of an insurance company according to its financial and economic indicators. The task of estimating the state of this type of an institution was considered as a problem of a binary classification: whether the company’s activity is efficient or not. During the research, six supervised machine learning methods were implemented: k-nearest neighbors, support vector machine, naive Bayes classifier, random forest, XGBoost and deep neural network. The created system allows the following: to perform correlation analysis of financial and economic indicators, to check the balance of data, to perform training of the selected model and to estimate quality of training, to predict the state of the insurance company according to the selected model. According to the best model, the future state of insurance companies in Ukraine was predicted.
doi_str_mv	10.20535/SRIT.2308-8893.2022.1.05
first_indexed	2025-07-17T10:27:52Z
format	Article
fulltext	 Р.С. Панібратов, 2022 Системні дослідження та інформаційні технології, 2022, № 1 61 TIДC ПРОБЛЕМИ ПРИЙНЯТТЯ РІШЕНЬ ТА УПРАВЛІННЯ В ЕКОНОМІЧНИХ, ТЕХНІЧНИХ, ЕКОЛОГІЧНИХ І СОЦІАЛЬНИХ СИСТЕМАХ УДК 004.852 DOI: 10.20535/SRIT.2308-8893.2022.1.05 СИСТЕМА ПІДТРИМАННЯ ПРИЙНЯТТЯ РІШЕНЬ ДЛЯ ОЦІНЮВАННЯ ТА ПРОГНОЗУВАННЯ СТАНУ СТРАХОВОЇ КОМПАНІЇ Р.С. ПАНІБРАТОВ Анотація. Створено систему підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії за її фінансово-економічними по- казниками. Оцінювання стану даної установи розглянуто як задачу бінарної класифікації: чи є діяльність компанії ефективною чи ні. Під час дослідження реалізовано шість методів машинного навчання з учителем: метод k-найближчих сусідів, метод опорних векторів, наївний байєсівський кла- сифікатор, випадковий ліс, XGBoost та глибоку нейронну мережу. Створена система дозволяє: виконувати кореляційний аналіз фінансово-економічних по- казників, перевіряти збалансованість даних, навчати обрану модель та оціню- вати якість навчання, прогнозувати стан страхової компанії за обраною модел- лю. За найкращими моделями спрогнозовано майбутній стан страхових компаній України. Ключові слова: страхова компанія, система підтримання прийняття рішень, бінарна класифікація, метод k-найближчих сусідів, метод опорних векторів, наївний байєсівський класифікатор, випадковий ліс, градієнтний бустинг, нейронні мережі. ВСТУП Процес формування ринкової економіки будь-якої країни включає в себе надійний страховий захист суб’єктів господарювання. Саме це спонукає до пошуку ефективних засобів мобілізації фінансових ресурсів страхових ком- паній та їх цілеспрямованого використання. Для забезпечення надійності виконання зобов’язань даний тип установи має ефективно формувати та ви- користовувати фінансові ресурси. Надійний захист суб’єктів господарюван- ня потребує застосування ефективних механізмів мобілізації фінансових ресурсів страхових компаній та їх беспосереднього використання. Натепер наявні ефективні математичні методи оцінювання фінансових ризиків у страхуванні. Наприклад, стандарт Basel II та Solvency I заохочу- ють розвиток моделей управління та оцінювання ризиків фінансової сфери. Розрізняють два засоби аналізу ризиків — за позицією факторів ризику та за позицією наслідків ризикової події. За таким підходом математичні методи оцінювання ризиків поділяють на дві групи: методи, що ґрунтуються на аналізі наслідків («високорівневі моделі»), та методи, що ґрунтуються на Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 62 аналізі факторів ризику («низькорівневі моделі»). До першої групи належать моделі BIA, LDA та IMA. Такі методи не можна використовувати для роз- поділу ризиків за рівнем критичності та знаходження подій, що ведуть до реалізації ризику. Друга група охоплює такі методи, як регресійний аналіз, байєсівські мережі та методи нечіткої логіки. Ці методи навпаки можуть ви- рішувати такі завдання, але мають певні обмеження. Так, регресійні моделі гарантують високу точність оцінювання тільки за умови достатньо великих обсягів даних. Байєсівські мережі дозволяють враховувати прямі залежності рівнів ризиків від чинників ризику і залежності між чинниками ризику, але обчислення умовних імовірностей є доволі трудомісткими. Сьогоднішні теорії інформаційних технологій та бізнес-менеджменту і принципи побудови інтелектуальних систем вимагають того, щоб мета створення системи базувалася на цілеспрямованій та усвідомленій людській діяльності. До нинішніх напрямів розроблення людино-машинних систем належать системи автоматичного керування, експертні системи та системи підтримання прийняття рішень (СППР). Остання є найефективнішим засо- бом вирішення багатьох завдань [1]. Завдяки їй, особа, що приймає рішення, може, застосовуючи обчислювальні засоби, проектувати, порівнювати та вибирати альтернативні варіанти рішень найрізноманітнішими засобами. Мета роботи — розроблення та створення СППР, що дозволяє оцінити і прогнозувати майбутній стан страхової компанії за її статистично- економічними даними. Вона розглядалася як задача бінарної класифікації, тобто прогнозування ефективності діяльності компанії. МАТЕМАТИЧНІ МЕТОДИ ОЦІНЮВАННЯ СТАНУ СТРАХОВОЇ КОМПАНІЇ Для оцінювання та прогнозування стану страхових компаній реалізовано шість моделей класифікації: k-найближчих сусідів, метод опорних векторів, наївний байєсівський класифікатор, випадковий ліс, XGBoost та багатоша- ровий персептрон. Метод k-найближчих сусідів Метод k-найближчих сусідів — метричний алгоритм для задачі автоматич- ної класифікації об’єктів або регресії. У випадку задачі класифікації резуль- татом є належність об’єкта до відповідного класу. Об’єкт класифікується множиною голосів його сусідів, причому об’єкт відносять до класу, який є найбільш поширеним серед k -найближчих сусідів. Параметр k — констан- та і задається користувачем. Вектор ознак без мітки класифікується за до- помогою присвоєння мітки, яка найчастіше зустрічається серед k тренува- льних зразків, що найближче розташовані до цієї точки. Для дослідження розглядалися три найближчі сусіди та використовува- лася евклідова метрика відстані, оскільки такі параметри забезпечували най- вищий результат. Метод опорних векторів Метод опорних векторів — метод навчання з учителем, що використовуєть- ся як для задачі класифікації, так і для регресії. Надається набір навчальних зразків з позначенням належності до одного з двох класів. Алгоритм будує модель, що призначає кожен новий зразок до однієї чи іншої категорії, ство- рюючи її як неймовірнісний бінарний лінійний класифікатор. Метод опор- них векторів відображає навчальні зразки в точки у просторі, максимізуючи Система підтримання прийняття рішень для оцінювання та прогнозування … Системні дослідження та інформаційні технології, 2022, № 1 63 при цьому ширину проміжку між двома категоріями. Нові зразки у цьому випадку відображаються у той же простір і прогнозується їх належність до певного класу залежно від того, на який бік проміжку вони потрапляють. У формальному сенсі метод опорних векторів будує гіперплощину або множину гіперплощин у багатовимірному чи нескінченновимірному прос- торі. Придатне ділення даних досягається за рахунок гіперплощини, що має найбільшу відстань найближчих тренувальних зразків будь-якого класу (функціональна маржа), оскільки чим більша маржа, тим менша узагальнена помилка класифікатора. Наївний байєсівський класифікатор Наївний байєсівський класифікатор — простий імовірнісний класифікатор, який ґрунтується на застосуванні теореми Байєса з наївним припущенням щодо незалежності ознак. Для оцінювання параметрів моделей використо- вується метод максимальної правдоподібності, тобто працюючи з наївною байєсівською моделлю, можна і не знати теорії байєсівської ймовірнсоті і не використовувати байєсівські методи. Імовірнісна модель класифікатора — це модель вигляду ), ..., \| ( 1 nFFLp залежної змінної класу L з невеликою кількістю класів, що залежить від змінних nFF , ..., 1 . Використовуючи теорему Байєса, запишемо ймовірність: . ), , ( ) \| , , () ( ) , ..., \| ( 1 1 1 n n n FFp LFFpLp FFLp    Чисельник являє собою еквівалентність формули спільної ймовірності моделі вигляду ), ..., ,( 1 nFFLp , яку можна, використовуючи повторне засто- сування визначення умовної ймовірності, переписати у вигляді ) ... , \| () \| () ( ) , ..., ,( 1211 FLFpLFpLpFFLp n  . Застосуємо наївні припущення щодо умовної незалежності: нехай кожна ознака iF умовно незалежна від будь-якої іншої ознаки jF , якщо ji  , тобто ) \| ( ) , \| ( LFpFLFp iji  . Звідси спільну модель можна подати так:  ) \| () ... \| () \| () ( ) , ..., ,( 211 LFpLFpLFpLpFFLp nn   . ) \| ( 1 LFpCp i n i   . Відповідно до припущення про незалежності ознак імовірність за міт- кою класу .) \| () ( ), , ( 1 ) , ..., \| ( 1 1 1 LFpLp FFp FFLp i n in n    Випадковий ліс Випадковий ліс — алгоритм машинного навчання, який застосовується для задач регресії та класифікації. Він використовує ансамблеве навчання – ме- тод, що комбінує велику кількість класифікаторів для вирішення складних проблем. Алгоритм випадкового лісу складається з множини дерев рішень. Ліс, згенерований даним алгоритмом, навчається за допомогою беггінгу — ансамблевого метаалгоритму, що покращує точність алгоритмів машинного навчання за рахунок усереднення результатів [2]. Метод установлює резуль- тати на основі прогнозів дерев рішень. Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 64 Головна відмінність алгоритму випадкового лісу від алгоритму дерева рішення полягає в тому, що встановлення кореневих вузлів і відокремлення вузлів відбуваються випадково у першому випадку. Метод використовує беггінг для генерації необхідних прогнозів. Беггінг включає використання різних наборів даних з навчальної вибірки частіше ніж один. Навчальна ви- бірка складається зі спостережень та ознак, що використовуються для про- гнозів. Дерева рішень дають різні результати залежно від навчальних даних, що подаються до алгоритму. Результати ранжируються, а прогноз з найви- щою оцінкою обирається як кінцевий результат. Для задачі класифікації вибір остаточного результату відбувається за допомогою системи мажоритарного голосування. Вихід, обраний більшістю дерев рішень, стає кінцевим результатом випадкового лісу. XGBoost Бустинг — це підхід, що комбінує множину простих моделей у єдину ком- позиційну модель. Із додаванням більш простих моделей загальна модель перетворюється у сильний предиктор. За термінологією бустингу прості мо- делі називаються слабкими моделями. Градієнтний бустинг перевизначає бустинг як проблему числової оп- тимізації, у якій задача полягає у мінімізації функції втрат моделі за рахунок слабких моделей з використанням алгоритму градієнтного спуску. Оскільки градієнтний бустинг ґрунтується на мінімізації функції втрат, можуть вико- ристовуватися різні функції втрат, що можна застосовувати для задач регре- сії, класифікації тощо. Градієнтний бустинг — покрокова адитивна модель, що генерує навча- льні моделі протягом процесу навчання(додається одне дерево за один крок, дерева, що існують, у моделі не змінюються). Внесок слабкої моделі на- вчання до ансамблю грунтується на оптимізаційному процесі градієнтного спуску. Розрахований внесок кожного дерева базується на мінімізації зага- льної помилки сильної моделі. XGBoost — один з найбільш популярних варіантів градієнтного бусти- нгу. Це ансамблевий алгоритм машинного навчання, який базується на де- ревах рішень. Він використовує попередньо відсортований алгоритм та ал- горитм на основі гістограми для обчислення найкрашого поділу. Алгоритм на основі гістограм розбиває точки даних для ознаки на дискретні інтервали і використовує ці інтервали для знаходження значення поділу гістограми. Багатошаровий персептрон Це глибока штучна нейронна мережа, що складається із вхідного шару для отримання сигналу, вихідного шару для прийняття рішень або передбачення щодо вхідного сигналу, а між ними — довільна кількість шарів, які являють собою обчислювальну основу багатошарового персептрона. Архітектура нейронної мережі, що була створена для оцінювання стану страхових компаній, складалася з чотирьох прихованих шарів, де перший шар містив чотири нейрони, решта — вісім. Такої кількості достатньо для вирішення завдання оцінювання. Як функцію активації для прихованих ша- рів використовувалася функція гіперболічного тангенса: . )(tanh )( xx xx ee ee xxf      Система підтримання прийняття рішень для оцінювання та прогнозування … Системні дослідження та інформаційні технології, 2022, № 1 65 Оскільки розглядалася задача бінарної класифікації, то для вихідного шару нейронної мережі використовувалася функція «сигмоїд»: . 1 1 )( xe xf   Для навчання мережі як алгоритму оптимізації використовувався метод Adam, а для навчання башатошарового персептрона — методи: batch normalization (пакетне нормування) і dropout (вилучення). Batch normalization (пакетне нормування). Цей метод дає змогу під- вищити продуктивність навчання і стабілізувати роботу штучних нейронних мереж. Суть методу полягає у тому, що деяким шарам нейронної мережі на вхід подаються уже оброблені дані, що мають нульове математичне споді- вання та одиничну дисперсію. За рахунок пакетного нормування досягається більш швидка збіжність моделей, незважаючи на додаткові обчислення. Цей підхід дозволяє кожно- му шару мережі навчатися більш незалежно від інших шарів. Також виникає можливість використання більш високої швидкості навчання, оскільки паке- тне нормування гарантує, що виходи вузлів нейронної мережі не матимуть дуже великих чи малих значень. Крім того, метод є в деякому сенсі окремим механізмом регуляризації: такий підхід привносить у виходи прихованих шарів деякий шум. Моделі стають менш чутливими до початкової ініціалі- зації ваг. Нехай навчання моделі проводиться за допомогою пакетів B розмірні- стю n ]: } , ..., { 1 nxxB . Алгоритм пакетної нормалізації складається з таких кроків: 1. Обчислюється математичне сподівання і дисперсія пакета за формулами: i n i B x n    1 1 ; .) ( 1 2 1 2 Bi n i B x n    2. Нормалізуються дані пакета:    ˆ 2 B Bi i x x , де ε — константа, яка використовується для обчислювальної стійкості (на- лаштовується разом з іншими параметрами). 3. Застосовується операція стиску та зсуву:  ˆ ii xy де  — параметр стиску;  — параметр зсуву. Ці параметри налаштовуються перед початком навчання мережі. Dropout (вилучення). Однією з проблем, яка виникає під час будови нейронної мережі, є явище перенавчання. Метод вилучення — один з най- більш поширених засобів уникнення цієї проблеми завдяки простому алго- ритму та задовільним результатам [4]. Розглянемо шар нейронної мережі, що складається з N нейронів. Даний підхід вимикає нейрон з імовірністю p відповідно, залишає увімкненим з імовірністю pq 1  , причому ймовірність вимкнення будь- якого нейрона однакова. Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 66 Нехай )(xf — функція активації, тоді застосування дропауту для i-го нейрона записується таким чином: , 1            bxwfU jj N j ii де jw — ваги нейрона; b — зміщення; jx — вхідні дані, а ймовірність pP i ) 0(  . Ця формула використовується під час навчання моделі. Але оскільки на даному етапі нейрон залишається в мережі з імовірністю q , то на етапі тестування потрібно емулювати поведінки нейронної мережі, що була використана під час навчання. Для цього результат вихідного значення функції активації необхідно множити на коефіцієнт q :            bxwfqU jj N j i 1 . На практиці також використовують техніку зворотного дропауту. На відміну від звичайного методу, множення на коефіцієнт відбувається у про- цесі навчання, причому цей коефіцієнт дорівнює імовірності того, що ней- рон залишиться в мережі. А під час тестування значення нейрона залиша- ється таким самим, як і в методі зворотного поширення помилки. Тобто вихідне значення i -го нейрона на етапі навчання            bxwf q U jj N j ii 1 1 , а на етапі тестування . 1            bxwfU jj N j i АРХІТЕКТУРА І СХЕМА ФУНКЦІОНУВАННЯ СППР Архітектуру СППР, розроблену для оцінювання стану страхових компаній, зображено на рис. 1. Компоненти архітектури виконують такі функції: – інтерпретатор відповідає за безпосереднє завантаження даних дже- рела інформації. Як дані завантажують- ся файли формату *.XLSX; – СОДГР або система оброблення даних та генерації результатів відповідає за візуалізацію даних за допомогою графіків; – БЗД або база даних і знань відпо- відає за забезпечення оцінювання стану страхової компанії. Програма відображає значення метрик якості навчання моде- лей класифікації; Інтерпретатор СПР БЗД СОДГР Рис. 1. Архітектура СППР Система підтримання прийняття рішень для оцінювання та прогнозування … Системні дослідження та інформаційні технології, 2022, № 1 67 – СПР або система подання проміжних та остаточних результатів об- числень, дозволяє подавати результати. Програма забезпечує відображення прогнозу майбутнього стану страхової компанії та можливі причини в разі негативної оцінки стану. Схему роботи СППР показано на рис. 2. ДАНІ ДЛЯ ДОСЛІДЖЕННЯ Для дослідження роботи програми як дані взято основні показники діяльно- сті страхових компаній (у розрізі установ), відповідно до Постановки Кабі- нету Міністрів України № 835 із сайту Національного банку України. Як навчально-валідаційну вибірку використано показники за 2020 р. (185 ком- паній), а як тестову вибірку — показники за перше півріччя 2021 року (166 компаній). Мітка оцінки діяльності для навчання моделі заповнювалася у такий спосіб: обчислювалася рентабельність капіталу страхової компанії у відсотках. Якщо цей показник перевищував 10% [5], то компанії присвою- валася оцінка «ефективна», інакше — «неефективна». Кореляційну матрицю фінансових показників та графік страхових компаній за оцінкою діяльності за навчально-валідаційною вибіркою зображено відповідно на рис. 3 і 4. За кореляційною матрицею видно, що показник збитків до та після оподаткування є некорельованими. Під час дослідження розглядався випа- док повної вибірки та скороченої (без урахування збитків). Дані є незбалан- сованими, оскільки кількість страхових компаній з ефективною діяльністю становить лише 24%. Рис. 2. Схема функціонування СППР Метод k-найближчих квадратів Метод опорних векторів Наївний байесівський класифікатор Випадковий ліс XGBoost Багатошаровий персептрон Попереднє оброблення даних Візуалізація даних Завнтаження даних Використання моделі для прогнозування стану Вибір найкращої моделі Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 68 РЕЗУЛЬТАТИ ДОСЛІДЖЕННЯ Для проведення дослідів навчально-валідаційна вибірка розбивалася за співвідношенням 40:60 . Тренуальна вибірка мала розмірність 111, валі- даційна — 74. Для оцінювання якості моделей використвувалися метрики F1-Score, Roc-Auc, Balanced Accuracy. Результати навчання моделей наведено в табл. 1 і 2. Також будувалася матриця похибок для кожної моделі. Рис. 4. Графік страхових компаній за оцінкою діяльності за 2020 р. Неефективна 2020 р. Ефективна О ц ін ка д ія л ьн ос ті 76,22% 23,78% Активи Власний капітал Зобов’язання Страхові резерви Чисті зароблені страхові премії Премії підписані Премії, передані у перестрахування Страхові виплати та страхові відшкодування Витрати на оплату праці Фінансовий результат до оподаткування (прибуток) Фінансовий результат до оподаткування (збиток) Витрати з податку на прибуток Чистий фінансовий результат (прибуток) Чистий фінансовий результат (збиток) Оцінка діяльності -100 -0,75 -0,50 -0,25 -0,0 -0,25 -0,50 -0,75 -1,00 Ак ти ви Вл ас ни й ка пі та л Зо бо в’ яз ан ня С тр ах ов і р ез ер ви Чи ст і з ар об ле ні с тр ах ов і п ре мі ї П ре мі ї п ід пи са ні П ре мі ї, пе ре да ні у п ер ес тр ах ув ан ня С тр ах ов і в ип ла ти т а ст ра хо ві в ід ш ко ду ва нн я Ви тр ат и на о пл ат у пр ац і Ф іна нс ов ий р ез ул ьт ат д о оп од ат ку ва нн я (п ри бу то к) Ф ін ан со ви й ре зу ль та т д о оп од ат ку ва нн я (з би то к) Ви тр ат и з по да тк у на п ри бу то к Чи ст ий ф ін ан со ви й ре зу ль та т (п ри бу то к) Чи ст ий ф ін ан со ви й ре зу ль та т (з би то к) О ці нк а ді ял ьн ос ті Рис. 3. Кореляційна матриця даних Система підтримання прийняття рішень для оцінювання та прогнозування … Системні дослідження та інформаційні технології, 2022, № 1 69 Т а б л и ц я 1 . Результати навчання моделей класифікації для повного набору даних Модель F1-Score Roc-Auc Balanced Accuracy k-найближчих сусідів 0,91 0,92 0,92 Метод опорних векторів 0,76 0,81 0,94 Наївний байєсівський класифікатор 0,69 0,78 0,83 Випадковий ліс 0,94 0,94 0,94 XGBoost 0,91 0,94 0,94 Багатошаровий персептрон 0,91 0,92 0,92 Т а б л и ц я 2 . Результати навчання моделей класифікації для скороченого набору даних. Модель F1-Score Roc-Auc Balanced Accuracy k-найближчих сусідів 0,91 0,94 0,94 Метод опорних векторів 0,86 0,9 0,9 Наївний байєсівський класифікатор 0,77 0,86 0,86 Випадковий ліс 0,86 0,95 0,95 XGBoost 0,88 0,96 0,96 Багатошаровий персептрон 0,95 0,98 0,99 Матриці похибок моделей для випадку повної та скороченої вибірок показано на рис. 5 і 6. Рис. 5. Матриці похибок моделі за повного набору даних 56 56 53 Not efficient Efficient Tr ue k-nearest neighbors Tr ue Not efficient Efficient Support Vector Machine Tr ue Not efficient Efficient Naïve Bayesian Classifier Not efficient Efficient Predicted Not efficient Predicted Efficient Not efficient Predicted Efficient 56 55 56 Random Forest XGBoost Deep Neural Network Not efficient Efficient Tr ue Not efficient Efficient Tr ue Not efficient Efficient Tr ue Not efficient Efficient Predicted Not efficient Predicted Efficient Not efficient Predicted Efficient Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 70 Діаграму розподілу страхових компаній за прогнозною оцінкою стану зображено на рис. 7. За результатами таблиць можна бачити, що модель випадкового лісу показала найкращі результати серед усіх моделей. За скороченого набору даних метрики якості усіх моделей покращилися. Водночас багатошаровий персептрон продемонстрував майже ідеальні результати — його точність становила 99%. За матрицями наочно видно, що за повного набору даних найкращі результати має модель випадкового лісу. За скороченого набору даних для моделі k-найближчих сусідів, опорних векторів та наївного байє- сівського класифікатора зменшилася кількість помилково-негативних оці- нок, але збільшилася кількість помилково-позитивних оцінок. При цьому модель випадкового лісу, XGBoost та нейронної мережі взагалі не містили помилково-негативних оцінок. Для скороченого набору даних багатошаро- вий персептрон показав майже безпомилкові результати. Тому, вибираючи Рис. 7. Графік страхових компаній за спрогнозованою оцінкою діяльності О ц ін ка д ія л ьн ос ті Ефективна 76,22% 23,78% Неефективна 2021 р. Рис. 6. Матриці похибок моделі за скороченого набору даних 55 54 50 Not efficient Efficient Predicted Not efficient Predicted Efficient Not efficient Predicted Efficient Not efficient Efficient Tr ue Not efficient Efficient Tr ue Not efficient Efficient Tr ue 50 51 55 Not efficient Efficient Predicted Not efficient Predicted Efficient Not efficient Predicted Efficient Not efficient Efficient Tr ue Not efficient Efficient Tr ue Not efficient Efficient Tr ue Random Forest XGBoost Deep Neural Network k-nearest neighbors Support Vector Machine Naïve Bayesian Classifier Система підтримання прийняття рішень для оцінювання та прогнозування … Системні дослідження та інформаційні технології, 2022, № 1 71 найкращу модель для оцінювання та прогнозування страхових компаній, користувач має вирішити чи вводити показники збитків під час навчання моделей чи не вводити. ВИСНОВКИ Створено систему підтримання прийняття рішення, що дозволяє оцінити та спрогнозувати стан страхової компанії за її фінансово-економічними показ- никами. Для оцінювання та прогнозування стану страхових компаній реалі- зовано шість моделей класифікації: k-найближчих сусідів, метод опорних векторів, наївний байєсівський класифікатор, випадковий ліс, XGBoost та багатошаровий персептрон. За результатами дослідження зроблено висно- вок, що у випадку повної вибірки модель випадкового лісу показала най- кращі результати. Водночас багатошаровий персептрон показав майже ідеа- льні результати, навчаючись за скороченою вибіркою. Тому, вибираючи найкращу модель для оцінювання та прогнозування страхових компаній, потрібно прийняти рішення щодо того, чи використовувати показники збит- ків під час навчання моделей чи не використовувати, оскільки вони некоре- льовані. У подальших дослідженнях доцільно розглянути задачу побудови ко- мерційної системи підтримання прийняття рішень з функціями ретроспек- тивного аналізу попередніх сесій використання системи, а також адаптації моделей, що використовуються для класифікації досліджуваних об’єктів. ЛІТЕРАТУРА 1. О.С. Олексюк, Системи підтримки прийняття фінансових рішень. К.: Наук. думка, 1998, 508 с. 2. J. Ali, R. Khan, N. Ahmad, and I. Maqsood, “Random Forests and Decision Trees”, International Journal of Computer Science Issues (IJCSI), vol. 9, no. 3, pp. 272–278, 2012. 3. S. Ioffe and C. Szegedy, “Batch Normalization: Accelerating Deep Network Train- ing by Reducing Internal Covariate Shift”, ICML, vol. 37, pp. 448–456, 2015. 4. N. Srivatsava et al., “Dropout: A Simple Way to Prevent Neural Networks from Overfitting”, Journal of Machine Learning Research, vol. 15, pp. 1929–1958, 2014. 5. А.А. Шірінян та Л.В. Шірінян, “Показники ефективності страхового ринку України з позицій власників страхових компаній”, Ефективна економіка, № 10, 2019. doi: 10.32702/2307-2105-2019.10.172 Надійшла 12.01.2022 INFORMATION ON THE ARTICLE Roman S. Panibratov, ORCID: 0000-0002-8604-4420, Institute for Applied System Analysis of the National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institue”, Ukraine, e-mail: roman.panibratov@gmail.com СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ ОЦЕНИВАНИЯ И ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ СТРАХОВОЙ КОМПАНИИ / Р.С. Панибратов Р.С. Панібратов ISSN 1681–6048 System Research & Information Technologies, 2022, № 1 72 Аннотация. Создано систему поддержки принятия решений для оценивания и прогнозирования состояния страховой компании за её финансово- экономическими показателями. Оценивание состояния данного учреждения рассмотрено как задачу бинарной классификации: является ли деятельность страховой компании эффективной или нет. Во время исследования реализова- ны шесть методов машинного обучения с учителем: метод k-ближайших сосе- дей, метод опорных векторов, наивный байесовский классификатор, случай- ный лес, XGBoost и глубокая нейронная сеть. Созданная система позволяет: выполнить корреляционный анализ финансово-экономических показателей, проверять сбалансированность данных, обучать выбранную модель и оцени- вать качество обучения, прогнозировать состояние страховой компании по вы- бранной модели. По лучшим моделям спрогнозировано будущее состояние страховых компаний Украины. Ключевые слова: страховая компания, система поддержки принятия решений, бинарная классификация, метод k-ближайших соседей, метод опорных векто- ров, наивный байесовский классификатор, случайный лес, градиентный бус- тинг, нейронные сети. DECISION SUPPORT SYSTEM FOR ESTIMATING AND FORECASTING STATE OF INSURANCE COMPANY / R.S. Panibratov Abstract. The decision support system was created for estimating and forecasting the state of an insurance company according to its financial and economic indica- tors. The task of estimating the state of this type of an institution was considered as a problem of a binary classification: whether the company’s activity is efficient or not. During the research, six supervised machine learning methods were implemented: k- nearest neighbors, support vector machine, naive Bayes classifier, random forest, XGBoost and deep neural network. The created system allows the following: to per- form correlation analysis of financial and economic indicators, to check the balance of data, to perform training of the selected model and to estimate quality of training, to predict the state of the insurance company according to the selected model. Ac- cording to the best model, the future state of insurance companies in Ukraine was predicted. Keywords: insurance company, decision support system, binary classification, k- nearest neighbors, support vector machine, naive Bayes classifier, random forest, gradient boosting, neural networks. REFERENCES 1. O.S. Oleksiuk, Financial Decision Support Systems, (in ukr.). Kyiv: Naukova Dumka, 1998, 508 p. 2. J. Ali, R. Khan, N. Ahmad, and I. Maqsood, “Random Forests and Decision Trees”, International Journal of Computer Science Issues (IJCSI), vol. 9, no. 3, pp. 272–278, 2012. 3. S. Ioffe and C. Szegedy, “Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift”, ICML, vol. 37, pp. 448–456, 2015. 4. N. Srivatsava et al., “Dropout: A Simple Way to Prevent Neural Networks from Overfitting”, Journal of Machine Learning Research, vol. 15, pp. 1929–1958, 2014. 5. A.A. Shirinyan and L.V. Shirinyan, “Efficiency indicators of ukrainian insurance market from the position of owners of insurance companies”, Efektyvna ekonomika, vol. 10, 2019. doi: 10.32702/2307-2105-2019.10.172
id	journaliasakpiua-article-259157
institution	System research and information technologies
keywords_txt_mv	keywords
language	Ukrainian
last_indexed	2025-07-17T10:27:52Z
publishDate	2022
publisher	The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format	ojs
resource_txt_mv	journaliasakpiua/16/08ac91387c22830f3306521ca0fa6d16.pdf
spelling	journaliasakpiua-article-2591572022-06-21T10:27:50Z Decision support system for estimating and forecasting state of insurance company Система поддержки принятия решений для оценивания и прогнозирования состояния страховой компании Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії Panibratov, Roman insurance company decision support system binary classification k-nearest neighbors support vector machine naive Bayes classifier random forest gradient boosting neural networks страховая компания система поддержки принятия решений бинарная классификация метод k-ближайших соседей метод опорных векторов наивный байесовский классификатор случайный лес градиентный бустинг нейронные сети страхова компанія система підтримання прийняття рішень бінарна класифікація метод k-найближчих сусідів метод опорних векторів наївний байєсівський класифікатор випадковий ліс градієнтний бустинг нейронні мережі The decision support system was created for estimating and forecasting the state of an insurance company according to its financial and economic indicators. The task of estimating the state of this type of an institution was considered as a problem of a binary classification: whether the company’s activity is efficient or not. During the research, six supervised machine learning methods were implemented: k-nearest neighbors, support vector machine, naive Bayes classifier, random forest, XGBoost and deep neural network. The created system allows the following: to perform correlation analysis of financial and economic indicators, to check the balance of data, to perform training of the selected model and to estimate quality of training, to predict the state of the insurance company according to the selected model. According to the best model, the future state of insurance companies in Ukraine was predicted. Создано систему поддержки принятия решений для оценивания и прогнозирования состояния страховой компании за её финансово-экономическими показателями. Оценивание состояния данного учреждения рассмотрено как задачу бинарной классификации: является ли деятельность страховой компании эффективной или нет. Во время исследования реализованы шесть методов машинного обучения с учителем: метод k-ближайших соседей, метод опорных векторов, наивный байесовский классификатор, случайный лес, XGBoost и глубокая нейронная сеть. Созданная система позволяет: выполнить корреляционный анализ финансово-экономических показателей, проверять сбалансированность данных, обучать выбранную модель и оценивать качество обучения, прогнозировать состояние страховой компании по выбранной модели. По лучшим моделям спрогнозировано будущее состояние страховых компаний Украины. Створено систему підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії за її фінансово-економічними показниками. Оцінювання стану даної установи розглянуто як задачу бінарної класифікації: чи є діяльність компанії ефективною чи ні. Під час дослідження реалізовано шість методів машинного навчання з учителем: метод k найближчих сусідів, метод опорних векторів, наївний байєсівський класифікатор, випадковий ліс, XGBoost та глибоку нейронну мережу. Створена система дозволяє: виконувати кореляційний аналіз фінансово-економічних показників, перевіряти збалансованість даних, навчати обрану модель та оцінювати якість навчання, прогнозувати стан страхової компанії за обраною моделлю. За найкращими моделями спрогнозовано майбутній стан страхових компаній України. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2022-04-25 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/259157 10.20535/SRIT.2308-8893.2022.1.05 System research and information technologies; No. 1 (2022); 61-72 Системные исследования и информационные технологии; № 1 (2022); 61-72 Системні дослідження та інформаційні технології; № 1 (2022); 61-72 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/259157/255816
spellingShingle	страхова компанія система підтримання прийняття рішень бінарна класифікація метод k-найближчих сусідів метод опорних векторів наївний байєсівський класифікатор випадковий ліс градієнтний бустинг нейронні мережі Panibratov, Roman Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title	Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title_alt	Decision support system for estimating and forecasting state of insurance company Система поддержки принятия решений для оценивания и прогнозирования состояния страховой компании
title_full	Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title_fullStr	Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title_full_unstemmed	Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title_short	Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
title_sort	система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії
topic	страхова компанія система підтримання прийняття рішень бінарна класифікація метод k-найближчих сусідів метод опорних векторів наївний байєсівський класифікатор випадковий ліс градієнтний бустинг нейронні мережі
topic_facet	insurance company decision support system binary classification k-nearest neighbors support vector machine naive Bayes classifier random forest gradient boosting neural networks страховая компания система поддержки принятия решений бинарная классификация метод k-ближайших соседей метод опорных векторов наивный байесовский классификатор случайный лес градиентный бустинг нейронные сети страхова компанія система підтримання прийняття рішень бінарна класифікація метод k-найближчих сусідів метод опорних векторів наївний байєсівський класифікатор випадковий ліс градієнтний бустинг нейронні мережі
url	https://journal.iasa.kpi.ua/article/view/259157
work_keys_str_mv	AT panibratovroman decisionsupportsystemforestimatingandforecastingstateofinsurancecompany AT panibratovroman sistemapodderžkiprinâtiârešenijdlâocenivaniâiprognozirovaniâsostoâniâstrahovojkompanii AT panibratovroman sistemapídtrimannâprijnâttâríšenʹdlâocínûvannâtaprognozuvannâstanustrahovoíkompaníí

Система підтримання прийняття рішень для оцінювання та прогнозування стану страхової компанії

Репозитарії

Схожі ресурси