Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів

The problem of fuzzy clustering of large datasets that are sent for processing in both batch and online modes, based on a credibilistic approach, is considered. To find the global extremum of the credibilistic fuzzy clustering goal function, the modification of the swarm algorithm of crazy cats swar...

Full description

Saved in:
Bibliographic Details
Date:2021
Main Authors: Bodyanskiy, Yevgeniy, Shafronenko, Alina, Pliss, Iryna
Format: Article
Language:Ukrainian
Published: The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2021
Subjects:
Online Access:https://journal.iasa.kpi.ua/article/view/244607
Tags: Add Tag
No Tags, Be the first to tag this record!
Journal Title:System research and information technologies
Download file: Pdf

Institution

System research and information technologies
_version_ 1866302777136775168
author Bodyanskiy, Yevgeniy
Shafronenko, Alina
Pliss, Iryna
author_facet Bodyanskiy, Yevgeniy
Shafronenko, Alina
Pliss, Iryna
author_sort Bodyanskiy, Yevgeniy
baseUrl_str http://journal.iasa.kpi.ua/oai
collection OJS
datestamp_date 2022-02-09T17:33:09Z
description The problem of fuzzy clustering of large datasets that are sent for processing in both batch and online modes, based on a credibilistic approach, is considered. To find the global extremum of the credibilistic fuzzy clustering goal function, the modification of the swarm algorithm of crazy cats swarms was introduced, that combined the advantages of evolutionary algorithms and a global random search. It is shown that different search modes are generated by a unified mathematical procedure, some cases of which are known algorithms for both local and global optimizations. The proposed approach is easy to implement and is characterized by the high speed and reliability in problems of multi-extreme fuzzy clustering.
doi_str_mv 10.20535/SRIT.2308-8893.2021.3.09
first_indexed 2025-07-17T10:27:36Z
format Article
fulltext  Є.В. Бодянський, А.Ю. Шафроненко, І.П. Плісс, 2021 110 ISSN 1681–6048 System Research & Information Technologies, 2021, № 3 TIДC МАТЕМАТИЧНІ МЕТОДИ, МОДЕЛІ, ПРОБЛЕМИ І ТЕХНОЛОГІЇ ДОСЛІДЖЕННЯ СКЛАДНИХ СИСТЕМ УДК 004.8:004.032.26 DOI: 10.20535/SRIT.2308-8893.2021.3.09 ПРАВДОПОДІБНА НЕЧІТКА КЛАСТЕРИЗАЦІЯ ДАНИХ НА ОСНОВІ ЕВОЛЮЦІЙНОГО МЕТОДУ БОЖЕВІЛЬНИХ КОТІВ Є.В. БОДЯНСЬКИЙ, А.Ю. ШАФРОНЕНКО, І.П. ПЛІСС Анотація. Розглянуто задачу нечіткої кластеризації великих масивів, що по- даються на опрацювання як у пакетному, так і в онлайн режимах на основі правдоподібного підходу. Для відшукання глобального екстремуму цільової функції правдоподібної нечіткої кластеризації введено модифікацію ройового алгоритму зграй божевільних котів, яка об’єднує в собі переваги еволюційних алгоритмів та глобального випадкового пошуку. Показано, що різні режими пошуку породжуються уніфікованою математичною процедурою, окремими випадками якої є відомі алгоритми як локальної, так і глобальної оптимізації. Запропонований підхід є досить простим в обчислювальній реалізації і харак- теризується високою швидкодією та надійністю у задачах багатоекстремальної нечіткої кластеризації. Ключові слова: нечітка кластеризація, теорія правдоподібності, еволюційні методи оптимізації, правдоподібна нечітка кластеризація, центроїди- прототипи, котяча зграя, режим трасування, режим пошуку, рівень належності. ВСТУП Задача кластеризації є важливою частиною Data Mining, основною відмінні- стю якої є те, що в її основу покладено парадигму самонавчання, тобто від- сутність заздалегідь розміченої навчальної вибірки [1,2]. У межах цієї задачі сформувалася множина підходів для її розв’язання, проте з практичного по- гляду найбільш ефективними є методи нечіткої кластеризації, в основі яких лежить припущення, що формуються класи-кластери, які взаємно перети- наються, тобто одне і те ж спостереження (вектор або матриця) можуть од- ночасно належати до декількох класів. У межах нечіткої кластеризації склалися два основні напрями: імовір- нісні та можливісні методи [3, 4], які підтвердили свою ефективність розв’язання множини реальних задач, проте не позбавлені і низки недоліків. Це передусім чутливість імовірнісних алгоритмів до наявності викривлених збуреннями та викидами спостережень (алгоритми не мають робасних влас- тивостей), проблема збіжності в можливісній кластеризації, обчислювальні проблеми під час роботи з даними високої розмірності [4, 5], багатоекстре- мальність цільових функцій [6–9], яка спричиняє зупинку процесу кластери- зації в локальних екстремумах. Деякі з цих проблем можуть бути вирішені за допомогою правдоподібної нечіткої кластеризації [10, 11], основу якої Правдоподібна нечітка кластеризація даних на основі еволюційного методу … Системні дослідження та інформаційні технології, 2021, № 3 111 становить теорія довіри [12], однак проблема багатоекстремальності все од- но залишається. Для подолання цієї проблеми використання алгоритмів ге- нетичного пошуку та методу нечітких J-середніх [9], що є за суттю локаль- ним евристичним пошуком, у загальному випадку не гарантує відшукання глобального екстремуму. У цій ситуації перспективним видається викорис- тання так званого ройового інтелекту [13] і алгоритмів оптимізації на основі роїв частинок [14], серед яких вельми ефективними показали себе оптиміза- ційні методи котячих зграй [15–19] та їх різні модифікації [20, 22]. Пришвид- шити процес пошуку можна, використовуючи більш просунуті версії котя- чих методів оптимізації, такі як оптимізаційні методи божевільних котів (crazy cats) [23, 24] у поєднанні з математичним апаратом випадкового гло- бального пошуку [25, 26]. Цікавим є також поєднання ідей теорії правдопо- дібності з методами глобальної оптимізації на основі еволюційного алго- ритму божевільних котів для розв’язання широкого класу задач нечіткої кластеризації. ЗМІСТОВНА ПОСТАНОВКА ЗАВДАННЯ Вихідною інформацією для розв’язання задачі кластеризації є вибірка, що містить N n -вимірних векторів спостережень },...,...,{ 1 Nk xxxX  , яка по- винна бути розбита на m взаємно перетинних класів-кластерів. У процесі кластеризації мають бути знайдені центроїди-прототипи цих класте- рів ;,...,2,1, mqwq  рівні належності кожного спостереження kx до кожного кластера )(kUCl qq  і оцінювання правдоподібності )(kCrq того, що kx дійсно належить до qCl . При цьому важливо відзначити, що у загальному випадку )()( kCrkU qq  . ПРАВДОПОДІБНА НЕЧІТКА КЛАСТЕРИЗАЦІЯ ІЗ ФУНКЦІЯМИ НАЛЕЖНОСТІ СПЕЦІАЛЬНОГО ТИПУ Математично завдання правдоподібної нечіткої кластеризації пов’язане з мінімізацією цільової функції )),(()()),(( 2 1 1 q N k m q qqq wkxDkCrwkCrE      (1) за обмежень          qlmlkCrkCr kkCr kqkCr lq q q ;...,2,1 ,1)(sup)( ,5,0)(sup ,,1)(0 для всіх q і k , у яких 5,0)( kCrq . Тут 1 — фазіфікатор, 22 ),( qkqk wxwxD  — звичайна евклідова відстань. Треба зазначити, що цільова функція (1) майже збігається із цільовою функцією імовірнісної нечіткої кластеризації [4] з тією різницею, що в ній замість рівнів належності )(kUq використовуються рівні довіри )(kCrq , що дозволяє відмовитись від імовірнісних обмежень вигляду Є.В. Бодянський, А.Ю. Шафроненко, І.П. Плісс ISSN 1681–6048 System Research & Information Technologies, 2021, № 3 112 1)( 1   m q q kU . Зазначимо також, що за умови 2 (1) є близькою до цільової функції популярного методу нечітких с-середніх (FCM) Дж. Бездека [3]. Для оцінювання рівнів належності в правдоподібному підході викорис- товується функція належності вигляду )),(()( qkqq wxDkU  , яка є за суттю мірою подібності, що використовує оцінку відстані ),( qk wxD . У працях [10, 11] як таку функцію запропоновано використовувати вираз , ),(1 1 )( 2 qk q wxD kU   (2) який є дзвонуватою функцією щільності розподілу Коші з одиничним пара- метром ширини. Можна показати, що використання оцінок імовірнісної нечіткої належності            m ql l lkqk qk m l lk qk q wxDwxD wxD wxD wxD kU 1 1 1 21 1 2 1 1 2 1 1 1 2 1 1 2 )),(()),(( )),(( )),(( )),(( )(       1 1 2 1 1 1 2 )),(( )),(( 1 1 qk m ql l lk wxD wxD для 2 дозволяє отримати розподіл Коші 2 2 1 1 )( q qk q wx kU     з параметром ширини , 1 1 2 2      m ql l lk q wx (3) що є узагальненням (2) і збігається з ним за умови 12 q . Таким чином, рі- вні належности в правдоподібному підході збігаються з імовірнісними рів- нями належності, які використовуються у FCM. Таким чином, модифікований варіант процедури правдоподібної класте- ризації може бути записаний у вигляді: Правдоподібна нечітка кластеризація даних на основі еволюційного методу … Системні дослідження та інформаційні технології, 2021, № 3 113                                            , ))(( ))(( ,)(sup1)( 2 1 )( , )(sup )( )( , |||| 1 1 )( 1 1 2 2 N k q N k kq q l ql qq l q q q qk q kCr xkCr w kUkUkCr kU kU kU wx kU (4) де 2 q визначається виразом (3). Якщо ж дані надходять на оброблення послідовно в онлайн режимі, можна скористатися адаптивним правдоподібним методом кластеризації у вигляді:                                                     ,))(()1()1()()1( ,)1(sup1)1( 2 1 )1( , )1(sup )1( )1( , )1( ||)(|| 1 1 )1( , )( 1 )1( 1 2 2 1 1 2 1 2 kwxkCrkkwkw kUkUkCr kU kU kU k kwx kU kwx k qkqqq l ql qq l q q q qk q m ql l lk q (5) де )1(  k — параметр кроку навчання. Тут необхідно відзначити, що процедура (4) є результатом пакетної оп- тимізації цільової функції (1), а (5) — градієнтним алгоритмом пошуку екс- тремуму цієї ж функції, тобто гарантується відшукання тільки локального екстремуму. Водночас у працях [6, 7] показано, що задачу умовної оптимі- зації цільової функції ймовірнісної нечіткої кластеризації можна подати у вигляді задачі безумовної оптимізації функції Є.В. Бодянський, А.Ю. Шафроненко, І.П. Плісс ISSN 1681–6048 System Research & Information Technologies, 2021, № 3 114                1 1 1 )1(2 )( N k m q qkq wxwE або за умови 2 : ,)( 1 1 1 2                N k m q qkq wxwE що має множину локальних екстремумів. Тому можна говорити про відшу- кання лише одного з них, найближчого до початкової точки пошуку. Саме таким екстремумом є ройові алгоритми оптимізації, які повинні бути відпо- відним чином адаптовані до розглянутої задачі і відповідати вимогам висо- кої швидкодії. АЛГОРИТМ ГЛОБАЛЬНОЇ ОПТИМІЗАЦІЇ БОЖЕВІЛЬНОЇ КОТЯЧОЇ ЗГРАЇ В ЗАДАЧІ НЕЧІТКОЇ КЛАСТЕРИЗАЦІЇ Для пошуку глобального екстремуму цільової функції нечіткої кластеризації пропонується використовувати модифікований метод оптимізації божевіль- ної котячої зграї, синтезований на основі оптимізаційного підходу котячої зграї [16–24] і методів глобального випадкового пошуку [25, 26]. Ідея оптимізації на основі еволюційного алгоритму котячої зграї поля- гає в тому, що формується група-зграя котів, кожен з яких рухається у на- прямку або локального, або глобального екстремуму прийнятої цільової фу- нкції )( qwE . При цьому ця зграя складається з Q особин Qpcat p ,...,2,1,  , кожна з яких може перебувати в одному з двох можливих станів: режим пошуку (SM) локальних екстремумів і режим погоні (TM), що ставить собі за мету відшукання глобального екстремуму; SM, як правило, реалізується на основі градієнтного пошуку з малим параметром навчання і таким чином сканує локальний окіл кожного з котів, що міститься в цьому режимі, TM характеризується випадковими стрибками з великою амплітудою і ставить собі за мету «витягти» кота pcat з локального екстремуму в разі його потрапляння туди. У загальному випадку стандартному алгоритму котячої зграї можна на- дати вигляду послідовності ітерацій [15, 16]: CS1: випадковим чином створюється зграя з Q котів pcat , кожен з яких є за суттю n -вимірним вектором )0(pw в області визначення функції, що оптимізується, та оцінюється значення функції в цій точці ))0(( pwE . CS2: уводиться параметр стану SPC, що набуває значення 0 або 1, за допомогою якого вихідна зграя розбивається випадковим чином на дві групи: якщо SPC = 1, то кіт перебуває в режимі пошуку, якщо ж SPC = 0, то відповідий кіт перебуває в режимі погоні. CS3: коти з SPC = 1 починають пошук локального екстремуму, а коти з SPC = 0 запускаються в режим погоні. Правдоподібна нечітка кластеризація даних на основі еволюційного методу … Системні дослідження та інформаційні технології, 2021, № 3 115 CS4: оцінюються значення цільової функції для всіх котів і зберігають- ся всі )1(pw з найменшими значеннями цієї функції, коти з найбільшим зна- ченням ))1(( pwE можуть бути видалені зі зграї. CS5: повернення до CS1 з новими значеннями, тобто починається но- вий етап з оновленою популяцією. У загальному випадку обидва режими SM і TM реалізуються паралель- но, при цьому SM фактично базується на основі покоординатного спуску, тобто в кожен конкретний момент часу може змінюватися тільки одна коор- дината n -вимірного простору пошуку, що природно знижує швидкодію процедури. У режимі погоні швидкості руху по кожній координаті також оцінюються незалежно одна від одної, що знову-таки знижує швидкодію. Для подолання цих недоліків у праці [21] був запропонований рандомі- зований алгоритм оптимізації на основі котячих зграй, що забезпечує під- вищену швидкодію порівняно з відомою процедурою-прототипом. При цьому рух кота в режимі пошуку можна описати за допомогою рекурентної процедури )),(()()1(   pSMpp wEww де ))((   pwE — оцінка градієнта функції, що оптимізується в точці )(pw , одержувана або на основі пошуку з центральною пробою [25], або на основі випадкових проб (статистичний градієнт [26]); SM — малий крок пошуку в просторі nR . Рух кота в режимі погоні описується алгоритмом, що є гібридом попу- лярного методу оптимізації важкої кульки і випадкового пошуку [22]: ),())(())1()(()()1(   pTMpppp wEwwww (6) де 10  — параметр інерції режиму погоні; )( — випадкове збурен- ня, що вводить додаткове сканування простору пошуку. У працях [23, 27] для поліпшення процесу пошуку глобального екстре- муму в режимі погоні в алгоритм руху кожного кота додатково був уведе- ний «фактор божевільності», який описується набором випадкових парамет- рів і дозволяє здійснювати раптові стрибки, що змінюють траєкторію руху шляхом варіювання характеристик сигналу збурення )( . Для керування сигналом )( доцільно скористатися ідеєю блукаючо- го глобального пошуку [26], який довів свою ефективність розв’язання бага- тоекстремальних задач. При цьому характеристики випадкового збурення Л. Растригін [25, 26] запропонував змінювати відповідно до виразу )()))1(())((()1()( 2 kHwEwE pp  , (7) де  — параметр коригування характеристик збурення; 10  — пара- метр швидкості самонавчання типу параметра інерції  у праці (6); 2 — дисперсія білого шуму )(H . Є.В. Бодянський, А.Ю. Шафроненко, І.П. Плісс ISSN 1681–6048 System Research & Information Technologies, 2021, № 3 116 Таким чином, весь процес оптимізації за допомогою підходу божевіль- них котів можна описати за допомогою рекурентних співвідношень (6), (7), при цьому, якщо 0 , режим погоні автоматично переходить у ре- жим пошуку (рух по антіградіенту). РЕЗУЛЬТАТИ ЕКСПЕРИМЕНТАЛЬНИХ ДОСЛІДЖЕНЬ Щоб перевірити ефективність та оцінити працездатність і спроможність якісно кластеризувати великі обсяги даних розробленого методу, а також довести його перевагу над аналогами, проведено експериментальне дослі- дження за допомогою чотирьох різних навчальних вибірок, а саме: Іриси Фішера, Cancer, Вина та Glass [5] (табл. 1), параметричні характеристики яких наведено в табл. 2. Т а б л и ц я 1 . Характеристики навчальних вибірок Навчальна вибірка Кількість кластерів Кількість атрибутів Кількість спостережень Іриси Фішера 3 4 150 Cancer 2 9 683 Вина 3 13 178 Glass 6 8 214 Т а б л и ц я 2 . Порівняльні результати показників ефективності таких алгоритмів, як PSO, CSO Навчальна вибірка MSE PSO CSO Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів Найкраще 7104  10109  11104,8  Середнє 6107  9103,7  10102,5  Іриси Фішера Найгірше 5102,1  9103,9  10106,9  Найкраще 7103,1  10108  11105,8  Середнє 6107  9104,4  11106,7  Cancer Найгірше 51002,2  9108,6  10108,7  Найкраще 6104,1  10107  11105,9  Середнє 5105  9104  11106,6  Вина Найгірше 5102  9106  10108,6  Найкраще 7105,2  10109,7  11107,8  Середнє 6109,6  9105  11107,7  Glass Найгірше 5103  9109,5  10107,7  Аналізуючи та оцінюючи отримані результати експериментальних до- сліджень, можна зробити висновки, що запропонований метод правдоподіб- ної нечіткої кластеризації даних на основі еволюційного методу божевіль- Правдоподібна нечітка кластеризація даних на основі еволюційного методу … Системні дослідження та інформаційні технології, 2021, № 3 117 них котів забезпечує достатньо якісні результати кластеризації, що підтвер- джується експериментально. ВИСНОВКИ Запропоновано підхід до розв’язання багатоекстремальної задачі правдопо- дібної нечіткої кластеризації на основі модификованої оптимізаційної про- цедури божевільних котів. Особливістю запропонованої модифікованої процедури оптимізації є можливість керування випадковими збуреннями, що визначають властивості режиму трасування (стеження) котячої зграї. Відзначено, що і режим пошуку, і режим погоні формально можна описати в межах єдиної процедури з різними параметрами алгоритму оптимізації, син- тезованого на основі випадкової зграї божевільних котів у поєднанні з випад- ковим глобальним пошуком. Запропонований підхід є простим в обчислювальній реалізації і забез- печує високу швидкодію розв’язання задач нечіткої кластеризації. ЛІТЕРАТУРА 1. R. Xu and D.C. Wunsch, Clustering. Hoboken, N.J.: John Wiley & Sons, Inc., 2009. 2. C.C. Aggarwal, Data Mining: Text Book. Springer, 2015. 3. J.C. Bezdek, Pattern Recognition with Fuzzy Objective Function Algorithms. N.Y.: Plenum Press, 1981. 4. F. Höppner, F. Klawonn, R. Kruse, and T. Runkler, Fuzzy Clustering Analysis: Methods for Classification, Data Analysis and Image Recognition. Chichester: John Wiley &Sons, 1999. 5. UCI Machine Learning Repository, Data Sets. Available at: https://archive.ics.uci.edu/ 6. R.J. Hathaway and J.C. Bezdek, “Optimization of clustering criteria by reformula- tion”, IEEE Transactions on Fuzzy Systems, vol. 3, pp. 241–245, 1995. 7. N.R. Pal, J.C. Bezdek, and R.J. Hathaway, “Sequential Competitive Learning and the Fuzzy С-Means Clustering Algorithms”, Neural Networks, vol. 9, no. 5, pp. 787–796, 1996. 8. P. Hansen and N. Mladenović, “J-Means: A new local search heuristic for minimum sum-of-squares clustering”, Pattern Recognition, vol. 34, pp. 405–413, 2001. 9. N. Belacel, P. Hansen, and N. Mladenović, ”Fuzzy J-Means: A new heuristic for fuzzy clustering”, J. Pattern Recognition, vol. 35, pp. 2193–2200, 2002. 10. J. Zhou, Q. Wang, C.-C. Hung, and X. Yi, “Credibilistic clustering: the model and algorithms”, Int.J. of Uncertainty, Fuzziness and Knowledge-Based Systems, vol. 23, no. 4, pp. 545–564, 2015. 11. J. Zhou, Q. Wang, C.-C. Hung, “Credibilistic clustering algorithms via alternating cluster estimation”, J. Intell. Manuf., vol. 28, pp. 727–738, 2017. 12. B. Liu and Y. Liu, “Expected value of fuzzy variable and fuzzy expected value mod- els”, IEEE Transactions on Fuzzy Systems, vol. 10, no. 4, pp. 445–450, 2002. 13. C. Grosan, A. Abraham, and M. Chis, “Swarm intelligence in data mining”, Swarm Intelligence and Data Mining. Springer, Germany, 2006. 14. J. Kennedy and R. Eberhart, “Particle swarm optimization”, Proc. IEEE Int. Conf. on Neural Networks, vol. 4, pp. 1942–1948, 1995. 15. S.C. Chu, P.W. Tsai, and J.S. Pan, “Cat swarm optimization”, Lecture Notes in Arti- ficial Intellgence, vol. 4099, pp. 854–858. Berlin Heidelberg, Springer-Verlag, 2006. Є.В. Бодянський, А.Ю. Шафроненко, І.П. Плісс ISSN 1681–6048 System Research & Information Technologies, 2021, № 3 118 16. S.C. Chu and P.W. Tsai, “Computational Intelligence based on the behavior of cats”, Int. J. of Innovative Computing, Information, and Control, vol. 3, no. 1, pp. 163–173, 2007.  17. G. Panda, P.M. Pranhan, and B. Majhi, “Direct and inverse modeling of plants using cat swarm optimization”, Handbook of Swarm Intelligence, ALO 8; eds. B.K. Pani- grahi, Y. Shi, M-H. Zim. Springer-Verlag, Berlin Heidelberg, 2011, pp. 469–485.  18. M. Orouskhani, Y. Orouskhani, and M. Teshnehlab, “Average-inertia weighted cat swarm optimization”, Lecture Notes in Computing Science. Springer-Verlag, Berlin- Heildelberg, 2011, pp. 321–328.  19. M. Orouskhani, Y. Orouskhani, M. Mansouri, and M. Teshnehlab, “A novel cat swarm optimization algorithm for unconstrained optimization problems”, Int. J. Im- formation Technology and Computer Science, vol. 11, pp. 32–41, 2013.  20. Y. Zhang and Y. Tian, “An improved cat swarm optimization algorithm and applica- tion research”, Proc. 7th Int. Conf. on Advanced Computational Intelligence, Mount Wuyi, Fujian, China 2015, pp. 207–211.  21. A.Yu. Shafronenko, Ye.V. Bodyanskiy, and I.P. Pliss, “The Fast Modification of Evolutionary Bioinspired Cat Swarm Optimization Method”, Proc.2019 IEEE 8th International Conference on Advanced Optoelectronics and Lasers (CAOL), 2019, Sozopol, Bulgaria, pp. 548–552. doi: 10.1109 /CAOL46282. 2019.9019583. 22. A. Shafronenko and Ye. Bodyanskiy, “Adaptive fuzzy clustering approach based on evolutionary cat swarm optimization”, Proc. Third International Workshop on Com- puter Modeling and Intelligent Systems — CMIS, 2020, Zaporizhzhia, Ukraine, pp. 832–842. 23. S.K. Saha, R. Kar, D. Mandal, and S.P. Ghoshal, “IIR filter design with craziness based particle swarm optimization technique”, World Academy of Science, Engineer- ing and Technology, pp.1628–1635, 2011. 24. A. Sarangi, S.K. Sarangi, M. Mukherjee, and S.P. Panigrahi, “System identification by crazy-cat swarm optimization”, Proc. Int. Conf. on Microwave, Optical and Communication Engineering, Bhubaneswar, India- 2015, pp. 439–442. 25. L.A. Rastrigin, Statistical search methods [in rus.]. Moscow: Science, 1968. 26. L.A. Rastrigin, Extreme Control Systems [in rus.]. Moscow: Science, 1974. 27. Jian Zhou and Chih-Cheng Hung, A Generalized Approach to Possibilistic Cluster- ing Algorithms. Faculty Publications, 2007. 28. F.W. Young and R.M. Hamer, Theory and Applications of Multidimensional Scal- ing-Hillsdale. N.J.: Erlbaum, 1994. 29. A. Shafronenko, Ye. Bodyanskiy, I. Klymova, and O. Holovin, “Online credibilistic fuzzy clustering of data using membership functions of special type”, Proceedings of The Third International Workshop on Computer Modeling and Intelligent Systems (CMIS-2020), April 27–1 May 2020, Zaporizhzhia, pp. 744–753. Надійшла 01.07.2021 INFORMATION ON THE ARTICLE Yevgeniy V. Bodyanskiy, ORCID: 0000-0001-5418-2143, Kharkiv National University of Radio Electronics, Ukraine, e-mail: yevgeniy.bodyanskiy@nure.ua Alina Yu. Shafronenko, ORCID: 0000-0002-8040-0279, Kharkiv National University of Radio Electronics, Ukraine, e-mail: alina.shafronenko@nure.ua Iryna P. Pliss, ORCID: 0000-0001-7918-7362, Kharkiv National University of Radio Electronics, Ukraine, e-mail: iryna.pliss@nure.ua Правдоподібна нечітка кластеризація даних на основі еволюційного методу … Системні дослідження та інформаційні технології, 2021, № 3 119 ПРАВДОПОБНАЯ НЕЧЕТКАЯ КЛАСТЕРИЗАЦИЯ ДАННЫХ НА ОСНОВЕ ЭВОЛЮЦИОННОГО МЕТОДА БЕЗУМНЫХ КОТОВ / Е.В. Бодянский, А.Ю. Шафроненко, И.П. Плисс Аннотация. Рассмотрена задача нечеткой кластеризации больших массивов, которые подаются на обработку как в пакетном, так и онлайн режимах на ос- нове правдоподобного подхода. Для отыскания глобального экстремума целе- вой функции правдоподобной нечеткой кластеризации введена модификация роевого алгоритма стай безумных котов, которая объединяет в себе преимуще- ства эволюционных алгоритмов и глобального случайного поиска. Показано, что различные режимы поиска порождаются унифицированной математичес- кой процедурой, частными случаями которой являются известные алгоритмы как локальной, так и глобальной оптимизации. Предложенный подход являет- ся достаточно простым в вычислительной реализации и характеризуется высо- ким быстродействием и надежностью в задачах многоэкстремальной нечеткой кластеризации. Ключевые слова: нечеткая кластеризация, теория правдоподобности, эволю- ционные методы оптимизации, правдоподобная нечеткая кластеризация, центроиды-прототипы, кошачья стая, режим трассировки, режим поиска, уро- вень принадлежности. CREDIBILISTIC FUZZY CLUSTERING BASED ON EVOLUTIONARY METHOD OF CRAZY CATS / Ye.V. Bodyanskiy, A.Yu. Shafronenko, I.P. Pliss Abstract. The problem of fuzzy clustering of large datasets that are sent for processing in both batch and online modes, based on a credibilistic approach, is considered. To find the global extremum of the credibilistic fuzzy clustering goal function, the modification of the swarm algorithm of crazy cats swarms was introduced, that combined the advantages of evolutionary algorithms and a global random search. It is shown that different search modes are generated by a unified mathematical procedure, some cases of which are known algorithms for both local and global optimizations. The proposed approach is easy to implement and is characterized by the high speed and reliability in problems of multi-extreme fuzzy clustering. Keywords: fuzzy clustering, credibility theory, evolutionary methods of optimization, credibilistic fuzzy clustering, centroids-prototypes, cats swarm, tracing mode, seeking mode, membership level.
id journaliasakpiua-article-244607
institution System research and information technologies
keywords_txt_mv keywords
language Ukrainian
last_indexed 2025-07-17T10:27:36Z
publishDate 2021
publisher The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute"
record_format ojs
resource_txt_mv journaliasakpiua/2d/62f4d667cd47db7449fc0ac9401c2f2d.pdf
spelling journaliasakpiua-article-2446072022-02-09T17:33:09Z Credibilistic fuzzy clustering based on evolutionary method of crazy cats Правдопобная нечеткая кластеризация данных на основе эволюционного метода безумных котов Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів Bodyanskiy, Yevgeniy Shafronenko, Alina Pliss, Iryna нечітка кластеризація теорія правдоподібності еволюційні методи оптимізації правдоподібна нечітка кластеризація центроїди-прототипи котяча зграя режим трасування режим пошуку рівень належності нечеткая кластеризация теория правдоподобности эволюционные методы оптимизации правдоподобная нечеткая кластеризация центроиды-прототипы кошачья стая режим трассировки режим поиска уровень принадлежности fuzzy clustering credibility theory evolutionary methods of optimization credibilistic fuzzy clustering centroids-prototypes cats swarm tracing mode seeking mode membership level The problem of fuzzy clustering of large datasets that are sent for processing in both batch and online modes, based on a credibilistic approach, is considered. To find the global extremum of the credibilistic fuzzy clustering goal function, the modification of the swarm algorithm of crazy cats swarms was introduced, that combined the advantages of evolutionary algorithms and a global random search. It is shown that different search modes are generated by a unified mathematical procedure, some cases of which are known algorithms for both local and global optimizations. The proposed approach is easy to implement and is characterized by the high speed and reliability in problems of multi-extreme fuzzy clustering. Рассмотрена задача нечеткой кластеризации больших массивов, которые подаются на обработку как в пакетном, так и онлайн режимах на основе правдоподобного подхода. Для отыскания глобального экстремума целевой функции правдоподобной нечеткой кластеризации введена модификация роевого алгоритма стай безумных котов, которая объединяет в себе преимущества эволюционных алгоритмов и глобального случайного поиска. Показано, что различные режимы поиска порождаются унифицированной математической процедурой, частными случаями которой являются известные алгоритмы как локальной, так и глобальной оптимизации. Предложенный подход является достаточно простым в вычислительной реализации и характеризуется высоким быстродействием и надежностью в задачах многоэкстремальной нечеткой кластеризации. Розглянуто задачу нечіткої кластеризації великих масивів, що подаються на опрацювання як у пакетному, так і в онлайн режимах на основі правдоподібного підходу. Для відшукання глобального екстремуму цільової функції правдоподібної нечіткої кластеризації введено модифікацію ройового алгоритму зграй божевільних котів, яка об’єднує в собі переваги еволюційних алгоритмів та глобального випадкового пошуку. Показано, що різні режими пошуку породжуються уніфікованою математичною процедурою, окремими випадками якої є відомі алгоритми як локальної, так і глобальної оптимізації. Запропонований підхід є досить простим в обчислювальній реалізації і характеризується високою швидкодією та надійністю у задачах багатоекстремальної нечіткої кластеризації. The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" 2021-09-30 Article Article application/pdf https://journal.iasa.kpi.ua/article/view/244607 10.20535/SRIT.2308-8893.2021.3.09 System research and information technologies; No. 3 (2021); 110-119 Системные исследования и информационные технологии; № 3 (2021); 110-119 Системні дослідження та інформаційні технології; № 3 (2021); 110-119 2308-8893 1681-6048 uk https://journal.iasa.kpi.ua/article/view/244607/242423
spellingShingle нечітка кластеризація
теорія правдоподібності
еволюційні методи оптимізації
правдоподібна нечітка кластеризація
центроїди-прототипи
котяча зграя
режим трасування
режим пошуку
рівень належності
Bodyanskiy, Yevgeniy
Shafronenko, Alina
Pliss, Iryna
Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title_alt Credibilistic fuzzy clustering based on evolutionary method of crazy cats
Правдопобная нечеткая кластеризация данных на основе эволюционного метода безумных котов
title_full Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title_fullStr Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title_full_unstemmed Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title_short Правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
title_sort правдоподібна нечітка кластеризація даних на основі еволюційного методу божевільних котів
topic нечітка кластеризація
теорія правдоподібності
еволюційні методи оптимізації
правдоподібна нечітка кластеризація
центроїди-прототипи
котяча зграя
режим трасування
режим пошуку
рівень належності
topic_facet нечітка кластеризація
теорія правдоподібності
еволюційні методи оптимізації
правдоподібна нечітка кластеризація
центроїди-прототипи
котяча зграя
режим трасування
режим пошуку
рівень належності
нечеткая кластеризация
теория правдоподобности
эволюционные методы оптимизации
правдоподобная нечеткая кластеризация
центроиды-прототипы
кошачья стая
режим трассировки
режим поиска
уровень принадлежности
fuzzy clustering
credibility theory
evolutionary methods of optimization
credibilistic fuzzy clustering
centroids-prototypes
cats swarm
tracing mode
seeking mode
membership level
url https://journal.iasa.kpi.ua/article/view/244607
work_keys_str_mv AT bodyanskiyyevgeniy credibilisticfuzzyclusteringbasedonevolutionarymethodofcrazycats
AT shafronenkoalina credibilisticfuzzyclusteringbasedonevolutionarymethodofcrazycats
AT plissiryna credibilisticfuzzyclusteringbasedonevolutionarymethodofcrazycats
AT bodyanskiyyevgeniy pravdopobnaânečetkaâklasterizaciâdannyhnaosnoveévolûcionnogometodabezumnyhkotov
AT shafronenkoalina pravdopobnaânečetkaâklasterizaciâdannyhnaosnoveévolûcionnogometodabezumnyhkotov
AT plissiryna pravdopobnaânečetkaâklasterizaciâdannyhnaosnoveévolûcionnogometodabezumnyhkotov
AT bodyanskiyyevgeniy pravdopodíbnanečítkaklasterizacíâdanihnaosnovíevolûcíjnogometoduboževílʹnihkotív
AT shafronenkoalina pravdopodíbnanečítkaklasterizacíâdanihnaosnovíevolûcíjnogometoduboževílʹnihkotív
AT plissiryna pravdopodíbnanečítkaklasterizacíâdanihnaosnovíevolûcíjnogometoduboževílʹnihkotív