Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом

В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распо...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Искусственный интеллект
Datum:2013
1. Verfasser: Максимова, А.Ю.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2013
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/85165
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859681255960870912
author Максимова, А.Ю.
author_facet Максимова, А.Ю.
citation_txt Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос.
collection DSpace DC
container_title Искусственный интеллект
description В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распознавания, а также предложен метод принятия решения по этой модели. У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються. У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а також запропоновано метод прийняття рішення за цією моделлю. In this paper we propose a method for pattern recognition problems with strongly overlapping classes of images. The method for optimal according to some validation measure number of clusters for FCMalgorithm is implemented. The classification model that describes the data structure for pattern recognition problem and the decision making method for this model are proposed.
first_indexed 2025-11-30T18:29:47Z
format Article
fulltext ISSN 1561-5359 «Штучний інтелект» 2013 № 3 171 3М УДК 004.891:004.827:004.931 А.Ю. Максимова Институт прикладной математики и механики НАН Украины, Украина Украина, 83050, г. Донецк, ул. Розы Люксембург, 74 Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом A. Maksymova Insitute of Applied Mathematics and Mechanics NAS of Ukraine, Ukraine Ukraine, 83050, c. Donetsk, Roza Luksemburg av., 74 Decision Making Method for Classifying Models Based on Intra-class Clustering on FCM-algorithm О.Ю. Максимова Інститут прикладної математики і механіки НАН України, Україна Україна, 83050, м. Донецьк, вул. Рози Люксембург, 74 Метод прийняття рішень для моделі класифікації, що заснована на внутрікласової кластеризації FCM-алгоритмом В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распознавания, а также предложен метод принятия решения по этой модели. Ключевые слова: нечеткий классификатор, нечеткая кластеризация, принятие решений. In this paper we propose a method for pattern recognition problems with strongly overlapping classes of images. The method for optimal according to some validation measure number of clusters for FCM- algorithm is implemented. The classification model that describes the data structure for pattern recognition problem and the decision making method for this model are proposed. Key words: fuzzy classifier, fuzzy clustering, decision making. У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються. У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а також запропоновано метод прийняття рішення за цією моделлю. Ключові слова: нечiткий класифікатор, нечiтка кластеризацiя, прийняття рiшень. Введение При построении классификационных моделей для решения задач распознавания образов используют методы машинного обучения, например, машину опорных векторов, нейронные сети и т.д. Однако высокая точность таких моделей достигается за счет их сложности и, как следствие, низкой прозрачности. Все методы распознавания разделя- Максимова А.Ю. «Искусственный интеллект» 2013 № 3 172 3М ют на две группы: дискриминативные алгоритмы, которые строят разделяющую границу между классами; и генеративные алгоритмы, которые строят прототипы классов образов. Классификационные модели, построенные в рамках дискриминативного подхода для задач распознавания с существенно пересекающимися классами образов, обладают низкой обобщающей способностью [1]. С другой стороны, генеративный подход позво- ляет решить эту проблему. Однако, четкие методы в спорных ситуациях на границах классов всегда будут давать некоторую ошибку. В таком случае проблема может быть решена с использованием нечеткого подхода, когда результатом работы алгоритма будет вектор степеней уверенности, с которой объект отнесен к тому или иному классу образов. Тогда для объектов, попадающих в области пересечения, т.е. типичных для нескольких классов образов, будет получена существенная информация, на основании которой можно принять корректное решение. Методы распознавания образов, в ко- торых используются нечеткие множества, объединяют под названием нечеткие клас- сификаторы [2]. Существуют несколько подходов для построения нечетких класси- фикаторов: настройка базы ЕСЛИ-ТО правил эволюционными алгоритмами [3], [4], применение FyzzyLVQ и FSOM сетей [5], использование методов нечеткой класте- ризации [6]. Предложенная Л. Заде концепция информационных гранул, которая заключается в разбиении множества исходных данных на элементарные составляющие, может быть применена в рамках генеративного подхода к распознаванию. Одним из способов представления совокупности информационных гранул являются кластеры, а задача построения информационных гранул в условиях неопределенности решается методами нечеткой кластеризации [7, с. 203]. Цель работы: В данной статье предлагается новый способ построения нечеткого классификатора. В первой части статьи приведена общая постановка задачи распозна- вания образов в условиях неопределенности. Во второй части описан метод нечеткой кластеризации, основанный на известном алгоритме нечетких с-средних (FCM-алгорит- ме), который позволяет решить проблему поиска оптимального количества кластеров с точки зрения определенного критерия адекватности нечеткого разбиения. В третьей части описан новый метод принятия решения о принадлежности объекта определенному классу образов. В четвертой части на основании экспериментов показана эффективность предложенного метода. 1 Общая постановка задачи распознавания образов в условиях неопределенности Далее везде под R , N , M 2 будем, как обычно, понимать соответственно мно- жество действительных чисел, множество натуральных чисел, булеан множества M. Пусть О – множество объектов какой-либо природы, например, бензинов или вин. Пусть { } },{1, miif K∈ представляет собой семейство отображений iXOif →: , ставя- щих в соответствие каждому объекту из О значение i -го признака из множества iX . Область значений iX i-го признака может быть, например, подмножеством веще- ственных чисел. Пусть O 2⊆A – множество классов объектов. Пусть Ω – некоторое множество. Поставим во взаимооднозначное соответствие каждому элементу A∈A элемент множества Ω – имя класса объектов. Множество Ω назовем алфавитом клас- сов объектов. Метод принятия решения для модели классификации… «Штучний інтелект» 2013 № 3 173 3М Тогда алгоритм распознавания формально может быть представлен функцией Ω→×× ~ : 1 m XXD K , где Ω ~ – пространство нечетких множеств над Ω . Мы будем рассматривать задачу построения модели распознавания, реали- зующей функцию D по выборке прецедентов, заданной в виде конечного множества Ω××⊆ ×× 21 m XXXZ K . На основании построенной модели будем строить систему распознавания образов. Для открытых систем распознавания с течением времени могут появляться новые объекты с известными принадлежностями классам образов, которые должна учиты- вать модель. В связи с этим введем параметр t – дискретное время, от которого будет зависть обучающее множество ( )tZZt = . Выборку Z в начальный момент времени назовем 0Z ,а построенный по ней алгоритм распознавания 0D . Необходимо разра- ботать алгоритм дообучения классификационной модели. 2 Алгоритм кластеризации с неизвестным числом кластеров В данной работе для решения задачи распознавания предлагается выполнять предварительный анализ данных с целью установления внутриклассовой структуры для каждого класса образов. Для этих целей предлагается использовать FCM-алгоритм нечеткой кластеризации. Данный алгоритм для множества прецедентов { }n ii X 1= = x строит нечеткое c -разбиение в виде матрицы [ ] cnikuU × = , где iku – степень прина- длежности элемента i x кластеру с номером k , а c – количество кластеров, которая является параметром алгоритма. Рассмотрим три типа c -разбиений, которые будут использованы далее в работе: },<0;0;>;;10,|{= 1= ×c nuiuikukiUM ik n iikik m pcn ≤∀∃∀≤≤∀∈ ∑R (1) ,1= 1= =       ∀∈ ∑ iku c i kpcnMUfcnM (2) { }},1{0,= ∈∀∈ ikuikfcnMUhcnM , (3) где pcnM – возможностное, fcnM – нечеткое и hcnM – четкое c-разбиения. Кроме разбиения fcnMU ∈ , результатом работы FCM-алгоритма являются гео- метрические центры кластеров { } m ci R⊂gggG ,,,= 2 K . FCM-алгоритм минимизирует функционал Бездека-Данна: ( ) ( ) { },{ 2 1=1= ,=;;, G gxG U ikik c i n k FCM minduXUJ →∑∑ γ γ (4) при ограничениях: ,1,=,1,= 1= nkkxiku c i ∀∑ (5) где γ – коэффициент нечеткости, а ),( 2 gxd – квадрат расстояния между элемен- том x и центром кластера g . В данной работе рассматривается евклидово расстояние. Максимова А.Ю. «Искусственный интеллект» 2013 № 3 174 3М FCM-алгоритм ищет глобальный оптимум методом итеративной оптимизации, на каждом следующем шаге вычисляя по центрам кластеров степени принадлежности iku для объекта kx : ( ) ( ) nkci d d u jk ikc jik ≤≤≤≤                     − − ∑ 1,1, , , = 1 1 2 1= γ gx gx (6) а затем новые центры кластеров по iku : . γ γ ik kik k u u ∑ ∑ ⋅ n 1=k n 1=k )x( =g (7) Инициализация алгоритма осуществляется за счет определения начальных зна- чений прототипов кластеров. По обучающей выборке Z вычисляются минимальные if p1 и максимальные if p2 значения для каждого информативного признака i f , mi 1,= , а координаты центров кластеров вычисляются по формуле: 1)( )( = 1 + − + c k 12 k pp pg , (8) где ),,,(= 121111 mfff ppp Kp , а ),,,(= 222122 mfff ppp Kp , ck ≤≤1 , c– количество кластеров. Основным недостатком FCM-алгоритма является необходимость задавать в ка- честве параметра алгоритма количество кластеров c , что при исследовании структу- ры данных заранее неизвестно. Для решения проблемы поиска оптимального числа кластеров используют критерии оценки адекватности кластеров, что неформально можно описать как «наиболее подходящая кластерная структура», которая для каждой задачи будет отличаться, поэтому и выбор критерия будет отличаться. Далее рассмотрим некоторые из возможных критериев адекватности кластеров. В четвертой части статьи будут рассмотрены экспериментальные результаты применения данных критериев для некоторых задач распознавания в рамках предложенной в дан- ной работе модели классификации. Коэффициент разбиения Бездека [8]: ( ) n u Uv ik c i n k PC 2 1=1== ∑∑ (9) где U − нечеткое с-разбиение, с –количество кластеров, n – количество элементов обучающей выборки X . Для PCv известны следующие свойства: hcnPC MUv ∈⇔1= , (10) U= 1 = 1 =       ⇔ c U c vPC , (11) где hcnM определено в (3), U – «самое нечеткое» разбиение, так как оно каждый элемента из X с одинаковой степенью уверенности относит к каждому из c -кластеров. Критерий разбиения Бездека относится к классу критериев, которые используют толь- ко информацию о разбиении U , но не использует информацию о самих данных, такую как прототипы кластеров G и X . Метод принятия решения для модели классификации… «Штучний інтелект» 2013 № 3 175 3М К классу критериев адекватности, которые используют полную информацию );,( XU G , относится индекс Кси-Бени: ( ) , )(s n = )min( u =;, 2 ji ji 2 ik 2 i n 1=k c 1=i                         − − ≠ ∑∑ G gg gx G ep n XUv k XB σ 321 (12) где σ – полная вариация по ),( GU , а ( )Gsep – разделение поG ( ) ( ),=;;, 22 1=1= ikik n k c i uXU gxG −∑∑σ (13) ( ) .min= 2       − ≠ ji ji sep ggG 321 (14) Чем меньше значение XBv , тем лучшее разбиение на X получено, что верно при 2=γ [8]. Исследования влияния коэффициента нечеткости на значение индекса Кси-Бени (12) говорят о его нестабильности для больших значений γ [8]. Предлагается искать оптимальное с точки зрения критерия * v количество кластеров по следующей схеме (рис. 1). Результатом работы предложенного метода будет мо- дель >,,,=< cXUFP G ω , которая, в рамках общей, предлагаемой автором, концепции, будет называться нечетким портретом класса образов Ω∈ω , где Ω – алфавит классов образов задачи распознавания [9]. Рисунок 1 − Общая схема построения модели класса образов На схеме m X R⊂ ω соответствует входным данным алгоритма, причем индекс ω указывает на то, что схема решает задачу внутриклассового анализа данных, где Ω∈ω – имя анализируемого класса образов, однако в общем случае это не обязательно; ( ) [ ]mm X 0,1:N aR ω – процедура нормализации обучающей выборки, X – нормали- зованная выборка; FCMC – алгоритм кластеризации, формально представленный функ- цией ( ) fcn mn FCM McXC aK × R:,; , где c − количество элементов обучающей выбо- Максимова А.Ю. «Искусственный интеллект» 2013 № 3 176 3М рки, fcnM – определено в (2), c – параметр алгоритма, задающей количество кластеров, а далее идут другие параметры FCM-алгоритма [6], [8]; * v – критерий адекватности, например, (9) или (12), а T n U         43421 K,11,1,= 1 –единичный вектор, }{= 1 1 gG , где 1g вычисляется по формуле (7) при условии, что 1 =UU . Диапазон значений max cc ,2,3,= K , причем nc max ≤ , где n – мощность множества ω X . В блоке построения модели выполняется анализ значений критерия качества. Для критерия (12) лучшим считается разбиение, для которого он минимален. Таким образом, рассмотренная схема построения внутриклассовой структуры в виде модели ω FP может быть применена для решения задачи распознавания образов с алфавитом классов },,,{= 21 Kωωω KΩ , где K – количество классов образов задачи, и известном множестве прецедентов Z . Сгруппируем элементы обучающей выборки Z по принадлежности классам образов, и представим эти группы как множества ( ) }),,,(|,,,{= 2121 ZxxxxxxX imm i ∈ω ω KK , Ki 1,=∀ . В результате применения предложенного алгоритма для каждого класса образов получаем свою локальную модель iFP ω . А теперь выполним простую операцию объеди- нения всех локальных моделей в единую нечеткую модель: { } ,>,=< 1= DFPFM K i iω (15) гдеD – алгоритм принятия решения по данным модели. Далее определим D и покажем, как можно решать задачу распознавания образов в условиях неопределенно- сти, используя только информацию данной модели (15). 3 Метод принятия решения Для объекта m R∈x результатом работы алгоритма распознавания образов в усло- виях неопределенности в соответствии с рассмотренной постановкой задачи, является нечеткое множество Ω∈ ~ ~ α , где Ω ~ – пространство нечетких множеств над Ω , ( ) ( ) ( ){ },,,,= ~ 2211 KK µωµωµωα K (16) а i µ – степень принадлежности x классу i ω . Основная идея предложенного в данной работе метода распознавания следующая. Настройка модели распознавания осуществляется по каждому классу образов отдельно, а на этапе принятия решения о том, к какому классу образов относится распознаваемый объект, используется информация по всем классам образов вместе. Преимуществом данного подхода является прозрачность полученной модели и следующая из способа ее построения способность к адаптации при появлении новых данных за счет дообучения. Далее рассмотрим основные шаги алгоритма принятия решения ( ) αε ~ =,,; * ΛFMxD , где FM -модель – (15), α ~ – в виде (16), ( ){ }m iifif pp 1= 21 ,=Λ – множество пар минималь- ных if p1 и максимальных if p2 значений, используемых при нормализации данных, i f – информативный признак, mi 1,= , m – количество информативных признаков, ε – Метод принятия решения для модели классификации… «Штучний інтелект» 2013 № 3 177 3М пороговое значение; а * x – новый объект, который необходимо распознать. При описа- нии алгоритма множество центров кластеров, соответствующих модели iFP ω , и их коли- чество, обозначим iG ω и i c ω соответственно. Шаг 1. Выполним преобразование * x в соответствии с Λ по формуле: 12 1 = pp px x * − − (17) где 1p и 2p как в формуле (8). Шаг 2. Для всех Ki i 1,=,ω вычисляем i µ , чтобы получить α ~ в виде (16). Переопределим ii µµωω =,= , iFPFP ω = . Вычислим расстояние от x до ближайшего центра кластера класса ω по мо- дели FP : ( )( ) ,,min= gx Gg dl ω ∈ (18) где d определено в (4). Определим множество ω B , которое состоит из всех центров кластеров модели, кроме данных для класса ω : ,= 1= kk ij j GB ωω U ≠ (19) где i – индекс класса ω . Для вычисления степени принадлежности µ определим следующую формулу: 1 2 2 ,( 1= − ∈         +∑ g)xg d l B ωµ (20) где l вычисляется по формуле (18), ω B определено в (19), а d определено в (4). Посчитанные в (20) µ для каждого ω подставим в α~ в виде (16). Шаг 3. Выполним следующее преобразование для полученного на шаге 4 нечеткого множества α~ . Исключим из рассмотрения классы с малыми значениями степеней увере- нности i µ , заменив α~ его α – срезом: , ,1 <,0 =    ≥ εµ εµ µ если если i (21) где ε – параметр алгоритма распознавания, соответствующий пороговому значе- нию. Шаг 4. Чтобы оценить качество построенной модели введем следующую операцию приведения к четкости ( )δα ; ~ H , которую будем называть операцией мультиклассового приведения к четкости с функцией отказа от распознавания: ( ) ( ) ( )    ∆ −≠∀ иначе jijiесли H jlilklll , >,,,,,, = ~ 21 δµµωωω α K , (22) где [0,1]∈δ – параметр алгоритма, ∆ – символ отказа от распознавания, 1l – номер класса образов, степень принадлежности к которому максимальная jcjmaxl µ1,=1 arg= , 2l – номер класса образов, для которого степень принадлежности Максимова А.Ю. «Искусственный интеллект» 2013 № 3 178 3М максимальная среди оставшихся классов образов jljcjmaxl µ 11,=2 arg= ≠∧ , и так далее, j kljcjk ljljmaxl µ 1211,= arg= − ≠ ≠∧∧≠∧∧ K , k – количество классов образов, к которым алгоритм относит рассматриваемый образец. Если 1>k , то образец x нахо- дится в области пересечения классов. 4 Результаты экспериментов Предложенный метод распознавания применяется для решения задач иденти- фикационной экспертизы в системах экспертного контроля. Под термином «иденти- фикация» в данном случае не подразумевается общеизвестный математический термин, а только понятие установления тождественности между реальным объектом и суще- ственными его характеристиками, заявленными в документации, в целях борьбы с фальсификациями. К таким задачам относится практическая задача идентификации производителя бензина [10], для которой проведен ряд экспериментов. Для оценки качества алгоритма распознавания будем делить выборку прецедентов на обучающую и тестовую в соотношении 2:1 для каждого класса соответственно. Для оценки качества алгоритма распознавания используется матрица неточно- стей Q . Элемент ijq матрицы неточностей определяет количество элементов тестовой выборки, для которых правильным классом образов является класс i ω , а алгоритмом распознавания он был отнесен к классу .jω В табл. 1 приведен пример матрицы не- точности для задачи распознавания с двумя классами образов. Искусственно введенный класс 0ω соответствует отказу от распознавания, как в функции (22). Таблица 1 − Матрица неточностей Метод Модель 0ω 1ω 2ω 1ω 10q 11q 12q 2ω 20q 21q 22q Пусть i p , Ki 1,= – априорная вероятность встречаемости элементов данного класса для задачи распознавания, 1= 1= i K i p∑ . Вычислим вероятность событий, при которой алгоритм определил, что объект класса i ω является объектом класса jω , KjKi 0,=,1,= : ,= 0= ik K k ij ij q q p ∑ ((23) где ijq – элементы матрицы неточности. Рассмотрим два типа ошибки для алгоритма с функцией отказа. Первый тип ошибки будет учитывать только ситуацию, когда алгоритм дал неправильный ответ, и будет определять вероятность ошибки алгоритма:           ∑∑ ≠ ij K ij ji K i I ppA 1=1= = . (24) Метод принятия решения для модели классификации… «Штучний інтелект» 2013 № 3 179 3М Вероятность отказов рассчитаем по формуле: .= 01= i K i qR ∑ (25) Тогда ошибка второго типа будет включать как неправильный ответ, так и отказ от распознавания и ее вероятность вычислим как: RAA III += (26) Далее в результате экспериментов качество модели оценивается по форму- лам (24), (25) и (26). Задача классификации вин. Первая группа экспериментов была выполнена для бенчмарк-задачи классификации вин, приведенной в [11]. Для каждой пробы вина известны 13 его характеристик, перечислим некоторые из них: содержание спирта, яблочной кислоты, флавоноидов и т.д. Даны результаты экспериментов для 178 проб вина для трех типов вин, для которых известно, из какого сорта винограда они произве- дены. Необходимо построить модель классификации, по которой можно было бы опре- делить для неизвестной пробы вина сорт винограда, из которого оно произведено. Алфавит классов образов для данной задачи распознавания состоит из трех элементов 3}V2,V1,V{=Ω , количество информативных признаков 13=m . В табл. 2 приведены значения критериев (12) XBv и (9) PCv . Таблица 2 − Значение критериев адекватности для задачи классификации вин с 1V,XBv 1V,XBv 1V,XBv 1V,PCv 2V,PCv 3V,PCv 1 – – – 1 1 1 2 11.47 27.88 8.75 0.51 0.50 0.52 3 59.12 124.25 43.36 0.34 0.34 0.36 4 308.73 438.12 104.95 0.25 0.25 0.27 Результат работы алгоритма при 0.01=δ 5,79%== III AA на тестовой выбо- рке и 0.69%= I A , 1.52%= II A на обучающей выборке в предположении, что классы встречаются с равной априорной вероятностью 3 1 === 321 VVV ppp . Результаты других исследовании для задачи классификации вин находятся в пре- делах 0% – 10% и указывают на то, что классы образов сильно пересекаются [11]. Таким образом, полученный результат подтверждает эффективность предложенного алгоритма. Выполним анализ значений коэффициентов адекватности, приведенных в табл. 2. Минимальное значение XBv для всех трех классов достигается при 2=с , а значение критерия c vPC 1 ≈ , что соответствует «предельно нечеткому разбиению», U , что было рассмотрено при описании свойств во второй части статьи. Таким образом, можно сде- лать вывод, что классы образов для данной задачи не имеют внутренней структуры, 1=c . Также значение XBv для 2V при 2=c больше, в сравнении со значением дан- ного критерия для классов 1V и 3V , что соответствует тому факту, что алгоритм распоз- навания ошибался именно на представителях класса 2V . Задача идентификации производителя бензина. Данная практическая задача возникает в лабораториях контроля качества нефтепродуктов при их реализации и на- правлена на борьбу с фальсификациями топлива. В качестве классов образов выступает бензин определенного производителя и определенной марки, а информативными призна- Максимова А.Ю. «Искусственный интеллект» 2013 № 3 180 3М ками являются физико-химические показатели образца. Предложенный метод распо- знавания используется в автоматизированной системе идентификации нефтепродуктов, разработанной для компании ООО «Параллель-М ЛТД». Значение ошибки первого типа для обучающих выборок за разные периоды не выше 4%, а ошибки второго типа не выше 12%. Такой показатель обусловлен тем, что классы сильно пересекаются. Выводы В данной статье предложен новый алгоритм распознавания для решения задачи в условиях неопределенности, который может быть использован при разработке откры- тых систем распознавания. Представление результата работы алгоритма распознавания в виде нечеткого множества, описывающего степень похожести объекта на каждый класс образов, позволяет решить проблему неопределенности. Предложенный алгоритм разработан и апробирован на задачах идентификацион- ной экспертизы. Для этих задач актуальны основные преимущества метода: прозрачность модели и возможность расширять модели при появлении новых данных. Литература 1. Воронцов К.В. Комбинаторный подход к оценке качества обучаемых алгоритмов / К.В. Ворон- цов // Математические вопросы кибернетики. – 2004. – № 13. – М. : Физматлит, 2004. – С. 5-36. 2. Kuncheva L.I. Fuzzy Classifier Design / Kincheva L.I. – Springer Verlag, 2000. – 315 p. 3. Ishibuchi H. Classification and Modeling with Linguistic Information Granules / H. Ishibuchi, T. Nakashima, M. Nii. – Spriger, 2005. – 307 p. 4. Сергиенко Р.Б. Коэволюционный генетический алгоритм решения сложных задач условной оптимизации / Р.Б. Сергиенко, Е.С. Семенкин // Вестник Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнёва. – № 2 (23). – 2009. – С. 17-21. 5. Chen N. Fuzzy Classification Using Self-Organizing Map and Learning Vector Quantization / N. Chen // CASDMKM 2004. Lecture Notes in Artificial Intelligence. – Springer-Verlag, 2004. – V. 3327. – P. 41-50. 6. Fuzzy Models and Algorithms for Pattern Recognition and Image Processing / [J.C. Bezdek, J. Keller, R. Krisnapuram, R. Pal]. – New York : Springer Verlag, 2005. – 785 p. 7. Handbook of Granular Computing / W. Pedrycz, A. Skowron, V. Kreinovich, [eds.]. – N.-Y. : John Wiley & Sons,2007. – 1116 p. 8. Pal N. On Cluster Validity for the Fuzzy c-Means Model / N. Pal, J. Bezdek // IEEE Transactions on Fuzzy System. – 1995. – V. 3, № 3. – P. 370-379. 9. Maksimova A. The Model of Data Presentation with Fuzzy Portraits for Pattern Recognition / A. Maksimova // International Journal of Computing. – 2012. – Vol. 11, Issue 1. – P. 17-24. 10. Козловский В.А. Нечеткая система распознавания образов для решения задач классификации жидких нефтепродуктов / В.А. Козловский, А.Ю. Максимова // Наукові праці ДонНТУ, Серія «Інформатика, кібернетика та обчислювальна техніка». – 2011. – №13 (185). – С. 200-205. 11. Frank A. UCI Machine Learning Repository. Wine Data Set. / A. Frank, Asuncion Irvine C.A. [Электронный ресур]. – University of California, School of Information and Computer Science. – 2010. – Режим доступа : [http://archive.ics.uci.edu/ml/ datasets/Wine]. Literatura 1. Vorontsov K.V. Сombinatorial approach to evaluating the quality of training algorithms / K.V. Vorontsov // Mathematical Problems of Cybernetics. - 2004. - № 13 - Moscow: Fizmatlit, 2004. – P. 5-36. 2. Kuncheva L. I. Fuzzy Classifier Design / Kincheva L.I. – Springer Verlag, 2000. – 315 p. 3. Ishibuchi H. Classification and Modeling with Linguistic Information Granules / H. Ishibuchi, T. Nakashima, M. Nii. – Spriger, 2005. – 307 p. Метод принятия решения для модели классификации… «Штучний інтелект» 2013 № 3 181 3М 4. Sergienko R.B. Co-evolutionary genetic algorithm to solve complex constrained optimization problems / R.B. Sergienko, E.S. Semenkin // Bulletin of the Siberian State Aerospace University named after Academician M.F. Reshetnev. – № 2 (23). – 2009. – P. 17-21. 5. Chen N. Fuzzy Classification Using Self-Organizing Map and Learning Vector Quantization / N.Chen // CASDMKM 2004. Lecture Notes in Artificial Intelligence. – V. 3327. – Springer-Verlag, 2004. – P. 41-50. 6. Bezdek J.C. Fuzzy Models and Algorithms for Pattern Recognition and Image Processing / J.C. Bezdek, J. Keller, R. Krisnapuram, R. Pal. – New York : Springer Verlag, 2005. – 785 p. 7. Handbook of Granular Computing / W. Pedrycz, A. Skowron, V. Kreinovich, [eds.]. – N.-Y. : John Wiley & Sons,2007. – 1116 p. 8. Pal N. On Cluster Validity for the Fuzzy c-Means Model / N. Pal, J. Bezdek // IEEE Transactions on Fuzzy System. – 1995. – V. 3, № 3. – P. 370-379. 9. Maksimova A. The Model of Data Presentation with Fuzzy Portraits for Pattern Recognition / A. Maksimova // International Journal of Computing. – 2012. – Vol. 11, Issue 1. – P. 17-24. 10. Kozlowskyj V.A. Fuzzy pattern recognition system to solve the problems of liquid petrolium classification / V.A. Kozlowskyj, A. Yu. Maksymova // Proceedings of Donetsk National Technical University, Series «Informatics, Cybernetics and Computer Science». – 2011. – № 13 (185). – S. 200-205. 11. Frank. A. UCI Machine Learning Repository. Wine Data Set / A. Frank, Asuncion Irvine C.A. – University of California, School of Information and Computer Science. 2010. – [http://archive.ics. uci.edu/ml/ datasets/Wine]. RESUME A. Maksymova Decision Making Method for Classifying Models Based on Intra-class Clustering on FCM-algorithm This paper deals with pattern recognition method in conditions of uncertainty for open recognition systems. Decision support systems for identification examination are example of such systems, we discuss here. The formally formulation of the problem is presented. An algorithm for intra-class clustering based on FCM-algorithm is worked out. The Xie-Beni index is used to solve problem of searching optimal number of clusters. An algorithm for decision making is worked out. This algorithm calculates the membership degrees of recognizable object using the distances to prototypes of clusters. The function of multiclass defuzzyfication with rejection option is introduced, that allows to take into account the uncertainty of the result of the decision. The experiments confirmed the effectiveness of the method on reference problem of wine classification and on the petroleum identification problem. The work results are used in automated system for liquid petroleum checking. Статья поступила в редакцию 10.06.2013.
id nasplib_isofts_kiev_ua-123456789-85165
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-11-30T18:29:47Z
publishDate 2013
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Максимова, А.Ю.
2015-07-21T11:49:30Z
2015-07-21T11:49:30Z
2013
Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/85165
004.891:004.827:004.931
В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распознавания, а также предложен метод принятия решения по этой модели.
У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються. У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а також запропоновано метод прийняття рішення за цією моделлю.
In this paper we propose a method for pattern recognition problems with strongly overlapping classes of images. The method for optimal according to some validation measure number of clusters for FCMalgorithm is implemented. The classification model that describes the data structure for pattern recognition problem and the decision making method for this model are proposed.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Искусственный интеллект
Анализ и синтез коммуникационной информации
Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
Метод прийняття рішень для моделі класифікації, що заснована на внутрікласової кластеризації FCM-алгоритмом
Decision making method for classifying models based on intra-class clustering on FCM-algorithm
Article
published earlier
spellingShingle Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
Максимова, А.Ю.
Анализ и синтез коммуникационной информации
title Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
title_alt Метод прийняття рішень для моделі класифікації, що заснована на внутрікласової кластеризації FCM-алгоритмом
Decision making method for classifying models based on intra-class clustering on FCM-algorithm
title_full Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
title_fullStr Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
title_full_unstemmed Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
title_short Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
title_sort метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации fcm-алгоритмом
topic Анализ и синтез коммуникационной информации
topic_facet Анализ и синтез коммуникационной информации
url https://nasplib.isofts.kiev.ua/handle/123456789/85165
work_keys_str_mv AT maksimovaaû metodprinâtiârešeniâdlâmodeliklassifikaciipostroennoinaosnovevnutriklassovoiklasterizaciifcmalgoritmom
AT maksimovaaû metodpriinâttâríšenʹdlâmodelíklasifíkacííŝozasnovananavnutríklasovoíklasterizacíífcmalgoritmom
AT maksimovaaû decisionmakingmethodforclassifyingmodelsbasedonintraclassclusteringonfcmalgorithm