Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом
В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распо...
Gespeichert in:
| Veröffentlicht in: | Искусственный интеллект |
|---|---|
| Datum: | 2013 |
| 1. Verfasser: | |
| Format: | Artikel |
| Sprache: | Russisch |
| Veröffentlicht: |
Інститут проблем штучного інтелекту МОН України та НАН України
2013
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/85165 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859681255960870912 |
|---|---|
| author | Максимова, А.Ю. |
| author_facet | Максимова, А.Ю. |
| citation_txt | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос. |
| collection | DSpace DC |
| container_title | Искусственный интеллект |
| description | В статье предложен метод распознавания образов для задач с сильно пересекающимися классами
образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым
критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру
данных задачи распознавания, а также предложен метод принятия решения по этой модели.
У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються.
У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності
числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а
також запропоновано метод прийняття рішення за цією моделлю.
In this paper we propose a method for pattern recognition problems with strongly overlapping classes of
images. The method for optimal according to some validation measure number of clusters for FCMalgorithm
is implemented. The classification model that describes the data structure for pattern recognition
problem and the decision making method for this model are proposed.
|
| first_indexed | 2025-11-30T18:29:47Z |
| format | Article |
| fulltext |
ISSN 1561-5359 «Штучний інтелект» 2013 № 3 171
3М
УДК 004.891:004.827:004.931
А.Ю. Максимова
Институт прикладной математики и механики НАН Украины, Украина
Украина, 83050, г. Донецк, ул. Розы Люксембург, 74
Метод принятия решения для модели
классификации, построенной на основе
внутриклассовой кластеризации FCM-алгоритмом
A. Maksymova
Insitute of Applied Mathematics and Mechanics NAS of Ukraine, Ukraine
Ukraine, 83050, c. Donetsk, Roza Luksemburg av., 74
Decision Making Method for Classifying Models Based
on Intra-class Clustering on FCM-algorithm
О.Ю. Максимова
Інститут прикладної математики і механіки НАН України, Україна
Україна, 83050, м. Донецьк, вул. Рози Люксембург, 74
Метод прийняття рішень для моделі класифікації,
що заснована на внутрікласової кластеризації
FCM-алгоритмом
В статье предложен метод распознавания образов для задач с сильно пересекающимися классами
образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым
критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру
данных задачи распознавания, а также предложен метод принятия решения по этой модели.
Ключевые слова: нечеткий классификатор, нечеткая кластеризация, принятие решений.
In this paper we propose a method for pattern recognition problems with strongly overlapping classes of
images. The method for optimal according to some validation measure number of clusters for FCM-
algorithm is implemented. The classification model that describes the data structure for pattern recognition
problem and the decision making method for this model are proposed.
Key words: fuzzy classifier, fuzzy clustering, decision making.
У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються.
У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності
числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а
також запропоновано метод прийняття рішення за цією моделлю.
Ключові слова: нечiткий класифікатор, нечiтка кластеризацiя, прийняття рiшень.
Введение
При построении классификационных моделей для решения задач распознавания
образов используют методы машинного обучения, например, машину опорных векторов,
нейронные сети и т.д. Однако высокая точность таких моделей достигается за счет
их сложности и, как следствие, низкой прозрачности. Все методы распознавания разделя-
Максимова А.Ю.
«Искусственный интеллект» 2013 № 3 172
3М
ют на две группы: дискриминативные алгоритмы, которые строят разделяющую границу
между классами; и генеративные алгоритмы, которые строят прототипы классов образов.
Классификационные модели, построенные в рамках дискриминативного подхода для
задач распознавания с существенно пересекающимися классами образов, обладают
низкой обобщающей способностью [1]. С другой стороны, генеративный подход позво-
ляет решить эту проблему. Однако, четкие методы в спорных ситуациях на границах
классов всегда будут давать некоторую ошибку. В таком случае проблема может быть
решена с использованием нечеткого подхода, когда результатом работы алгоритма
будет вектор степеней уверенности, с которой объект отнесен к тому или иному классу
образов. Тогда для объектов, попадающих в области пересечения, т.е. типичных для
нескольких классов образов, будет получена существенная информация, на основании
которой можно принять корректное решение. Методы распознавания образов, в ко-
торых используются нечеткие множества, объединяют под названием нечеткие клас-
сификаторы [2]. Существуют несколько подходов для построения нечетких класси-
фикаторов: настройка базы ЕСЛИ-ТО правил эволюционными алгоритмами [3], [4],
применение FyzzyLVQ и FSOM сетей [5], использование методов нечеткой класте-
ризации [6].
Предложенная Л. Заде концепция информационных гранул, которая заключается
в разбиении множества исходных данных на элементарные составляющие, может быть
применена в рамках генеративного подхода к распознаванию. Одним из способов
представления совокупности информационных гранул являются кластеры, а задача
построения информационных гранул в условиях неопределенности решается методами
нечеткой кластеризации [7, с. 203].
Цель работы: В данной статье предлагается новый способ построения нечеткого
классификатора. В первой части статьи приведена общая постановка задачи распозна-
вания образов в условиях неопределенности. Во второй части описан метод нечеткой
кластеризации, основанный на известном алгоритме нечетких с-средних (FCM-алгорит-
ме), который позволяет решить проблему поиска оптимального количества кластеров
с точки зрения определенного критерия адекватности нечеткого разбиения. В третьей
части описан новый метод принятия решения о принадлежности объекта определенному
классу образов. В четвертой части на основании экспериментов показана эффективность
предложенного метода.
1 Общая постановка задачи распознавания образов
в условиях неопределенности
Далее везде под R , N , M
2 будем, как обычно, понимать соответственно мно-
жество действительных чисел, множество натуральных чисел, булеан множества M.
Пусть О – множество объектов какой-либо природы, например, бензинов или вин.
Пусть { } },{1, miif
K∈
представляет собой семейство отображений iXOif →: , ставя-
щих в соответствие каждому объекту из О значение i -го признака из множества iX .
Область значений iX i-го признака может быть, например, подмножеством веще-
ственных чисел. Пусть O
2⊆A – множество классов объектов. Пусть Ω – некоторое
множество. Поставим во взаимооднозначное соответствие каждому элементу A∈A
элемент множества Ω – имя класса объектов. Множество Ω назовем алфавитом клас-
сов объектов.
Метод принятия решения для модели классификации…
«Штучний інтелект» 2013 № 3 173
3М
Тогда алгоритм распознавания формально может быть представлен функцией
Ω→××
~
:
1 m
XXD K , где Ω
~
– пространство нечетких множеств над Ω .
Мы будем рассматривать задачу построения модели распознавания, реали-
зующей функцию D по выборке прецедентов, заданной в виде конечного множества
Ω××⊆ ××
21 m
XXXZ K . На основании построенной модели будем строить систему
распознавания образов.
Для открытых систем распознавания с течением времени могут появляться новые
объекты с известными принадлежностями классам образов, которые должна учиты-
вать модель. В связи с этим введем параметр t – дискретное время, от которого будет
зависть обучающее множество ( )tZZt = . Выборку Z в начальный момент времени
назовем 0Z ,а построенный по ней алгоритм распознавания 0D . Необходимо разра-
ботать алгоритм дообучения классификационной модели.
2 Алгоритм кластеризации с неизвестным числом
кластеров
В данной работе для решения задачи распознавания предлагается выполнять
предварительный анализ данных с целью установления внутриклассовой структуры
для каждого класса образов. Для этих целей предлагается использовать FCM-алгоритм
нечеткой кластеризации. Данный алгоритм для множества прецедентов { }n
ii
X
1=
= x
строит нечеткое c -разбиение в виде матрицы [ ]
cnikuU
×
= , где iku – степень прина-
длежности элемента i
x кластеру с номером k , а c – количество кластеров, которая
является параметром алгоритма. Рассмотрим три типа c -разбиений, которые будут
использованы далее в работе:
},<0;0;>;;10,|{=
1=
×c
nuiuikukiUM ik
n
iikik
m
pcn ≤∀∃∀≤≤∀∈ ∑R (1)
,1=
1=
=
∀∈ ∑ iku
c
i
kpcnMUfcnM
(2)
{ }},1{0,= ∈∀∈ ikuikfcnMUhcnM , (3)
где pcnM – возможностное,
fcnM – нечеткое и hcnM – четкое c-разбиения.
Кроме разбиения
fcnMU ∈
, результатом работы FCM-алгоритма являются гео-
метрические центры кластеров { } m
ci
R⊂gggG ,,,= 2 K . FCM-алгоритм минимизирует
функционал Бездека-Данна:
( ) ( )
{
},{
2
1=1=
,=;;,
G
gxG
U
ikik
c
i
n
k
FCM
minduXUJ →∑∑
γ
γ
(4)
при ограничениях:
,1,=,1,=
1=
nkkxiku
c
i
∀∑
(5)
где γ – коэффициент нечеткости, а ),(
2
gxd – квадрат расстояния между элемен-
том x и центром кластера g . В данной работе рассматривается евклидово расстояние.
Максимова А.Ю.
«Искусственный интеллект» 2013 № 3 174
3М
FCM-алгоритм ищет глобальный оптимум методом итеративной оптимизации, на
каждом следующем шаге вычисляя по центрам кластеров степени принадлежности iku
для объекта kx :
( )
( )
nkci
d
d
u
jk
ikc
jik ≤≤≤≤
−
−
∑ 1,1,
,
,
=
1
1
2
1=
γ
gx
gx
(6)
а затем новые центры кластеров по iku :
.
γ
γ
ik
kik
k
u
u
∑
∑ ⋅
n
1=k
n
1=k
)x(
=g
(7)
Инициализация алгоритма осуществляется за счет определения начальных зна-
чений прототипов кластеров. По обучающей выборке Z вычисляются минимальные
if
p1 и максимальные
if
p2 значения для каждого информативного признака
i
f , mi 1,= ,
а координаты центров кластеров вычисляются по формуле:
1)(
)(
= 1
+
−
+
c
k 12
k
pp
pg ,
(8)
где ),,,(= 121111 mfff ppp Kp , а ),,,(= 222122 mfff ppp Kp , ck ≤≤1 , c–
количество кластеров.
Основным недостатком FCM-алгоритма является необходимость задавать в ка-
честве параметра алгоритма количество кластеров c , что при исследовании структу-
ры данных заранее неизвестно. Для решения проблемы поиска оптимального числа
кластеров используют критерии оценки адекватности кластеров, что неформально
можно описать как «наиболее подходящая кластерная структура», которая для каждой
задачи будет отличаться, поэтому и выбор критерия будет отличаться.
Далее рассмотрим некоторые из возможных критериев адекватности кластеров.
В четвертой части статьи будут рассмотрены экспериментальные результаты применения
данных критериев для некоторых задач распознавания в рамках предложенной в дан-
ной работе модели классификации.
Коэффициент разбиения Бездека [8]:
( )
n
u
Uv
ik
c
i
n
k
PC
2
1=1==
∑∑
(9)
где U − нечеткое с-разбиение, с –количество кластеров, n – количество
элементов обучающей выборки X . Для PCv известны следующие свойства:
hcnPC MUv ∈⇔1= , (10)
U=
1
=
1
=
⇔
c
U
c
vPC ,
(11)
где hcnM определено в (3), U – «самое нечеткое» разбиение, так как оно каждый
элемента из X с одинаковой степенью уверенности относит к каждому из c -кластеров.
Критерий разбиения Бездека относится к классу критериев, которые используют толь-
ко информацию о разбиении U , но не использует информацию о самих данных, такую
как прототипы кластеров G и X .
Метод принятия решения для модели классификации…
«Штучний інтелект» 2013 № 3 175
3М
К классу критериев адекватности, которые используют полную информацию
);,( XU G , относится индекс Кси-Бени:
( ) ,
)(s
n
=
)min(
u
=;,
2
ji
ji
2
ik
2
i
n
1=k
c
1=i
−
−
≠
∑∑
G
gg
gx
G
ep
n
XUv
k
XB
σ
321
(12)
где σ – полная вариация по ),( GU , а ( )Gsep – разделение поG
( ) ( ),=;;,
22
1=1= ikik
n
k
c
i
uXU gxG −∑∑σ
(13)
( ) .min=
2
−
≠
ji
ji
sep ggG
321
(14)
Чем меньше значение XBv , тем лучшее разбиение на X получено, что верно
при 2=γ [8]. Исследования влияния коэффициента нечеткости на значение индекса
Кси-Бени (12) говорят о его нестабильности для больших значений γ [8].
Предлагается искать оптимальное с точки зрения критерия *
v количество кластеров
по следующей схеме (рис. 1). Результатом работы предложенного метода будет мо-
дель >,,,=< cXUFP G
ω
, которая, в рамках общей, предлагаемой автором, концепции,
будет называться нечетким портретом класса образов Ω∈ω , где Ω – алфавит классов
образов задачи распознавания [9].
Рисунок 1 − Общая схема построения модели класса образов
На схеме m
X R⊂
ω соответствует входным данным алгоритма, причем индекс ω
указывает на то, что схема решает задачу внутриклассового анализа данных, где Ω∈ω –
имя анализируемого класса образов, однако в общем случае это не обязательно;
( ) [ ]mm
X 0,1:N aR
ω
– процедура нормализации обучающей выборки, X – нормали-
зованная выборка; FCMC – алгоритм кластеризации, формально представленный функ-
цией ( ) fcn
mn
FCM McXC aK
×
R:,; , где c − количество элементов обучающей выбо-
Максимова А.Ю.
«Искусственный интеллект» 2013 № 3 176
3М
рки, fcnM – определено в (2), c – параметр алгоритма, задающей количество
кластеров, а далее идут другие параметры FCM-алгоритма [6], [8]; *
v – критерий
адекватности, например, (9) или (12), а
T
n
U
43421
K,11,1,=
1 –единичный вектор, }{= 1
1
gG ,
где 1g вычисляется по формуле (7) при условии, что 1
=UU . Диапазон значений
max
cc ,2,3,= K , причем nc
max
≤ , где n – мощность множества ω
X .
В блоке построения модели выполняется анализ значений критерия качества.
Для критерия (12) лучшим считается разбиение, для которого он минимален.
Таким образом, рассмотренная схема построения внутриклассовой структуры в
виде модели ω
FP может быть применена для решения задачи распознавания образов
с алфавитом классов },,,{= 21 Kωωω KΩ , где K – количество классов образов задачи,
и известном множестве прецедентов Z . Сгруппируем элементы обучающей выборки Z
по принадлежности классам образов, и представим эти группы как множества
( ) }),,,(|,,,{= 2121 ZxxxxxxX
imm
i
∈ω
ω
KK , Ki 1,=∀ .
В результате применения предложенного алгоритма для каждого класса образов
получаем свою локальную модель iFP
ω
. А теперь выполним простую операцию объеди-
нения всех локальных моделей в единую нечеткую модель:
{ } ,>,=<
1=
DFPFM
K
i
iω
(15)
гдеD – алгоритм принятия решения по данным модели. Далее определим D и
покажем, как можно решать задачу распознавания образов в условиях неопределенно-
сти, используя только информацию данной модели (15).
3 Метод принятия решения
Для объекта m
R∈x результатом работы алгоритма распознавания образов в усло-
виях неопределенности в соответствии с рассмотренной постановкой задачи, является
нечеткое множество Ω∈
~
~
α , где Ω
~
– пространство нечетких множеств над Ω ,
( ) ( ) ( ){ },,,,=
~
2211 KK µωµωµωα K (16)
а
i
µ – степень принадлежности x классу
i
ω .
Основная идея предложенного в данной работе метода распознавания следующая.
Настройка модели распознавания осуществляется по каждому классу образов отдельно,
а на этапе принятия решения о том, к какому классу образов относится распознаваемый
объект, используется информация по всем классам образов вместе. Преимуществом
данного подхода является прозрачность полученной модели и следующая из способа
ее построения способность к адаптации при появлении новых данных за счет дообучения.
Далее рассмотрим основные шаги алгоритма принятия решения ( ) αε
~
=,,;
*
ΛFMxD ,
где FM -модель – (15), α
~
– в виде (16), ( ){ }m
iifif
pp
1=
21 ,=Λ – множество пар минималь-
ных
if
p1 и максимальных
if
p2 значений, используемых при нормализации данных,
i
f –
информативный признак, mi 1,= , m – количество информативных признаков, ε –
Метод принятия решения для модели классификации…
«Штучний інтелект» 2013 № 3 177
3М
пороговое значение; а *
x – новый объект, который необходимо распознать. При описа-
нии алгоритма множество центров кластеров, соответствующих модели iFP
ω
, и их коли-
чество, обозначим iG
ω
и i
c
ω
соответственно.
Шаг 1. Выполним преобразование *
x в соответствии с Λ по формуле:
12
1
=
pp
px
x
*
−
−
(17)
где 1p и 2p как в формуле (8).
Шаг 2. Для всех Ki
i
1,=,ω вычисляем
i
µ , чтобы получить α
~
в виде (16).
Переопределим
ii
µµωω =,= ,
iFPFP
ω
= .
Вычислим расстояние от x до ближайшего центра кластера класса ω по мо-
дели FP :
( )( ) ,,min= gx
Gg
dl
ω
∈
(18)
где d определено в (4).
Определим множество ω
B , которое состоит из всех центров кластеров модели,
кроме данных для класса ω :
,=
1=
kk
ij
j
GB
ωω
U
≠
(19)
где i – индекс класса ω .
Для вычисления степени принадлежности µ определим следующую формулу:
1
2
2
,(
1=
−
∈
+∑
g)xg
d
l
B
ωµ
(20)
где l вычисляется по формуле (18),
ω
B определено в (19), а d определено в (4).
Посчитанные в (20) µ для каждого ω подставим в α~ в виде (16).
Шаг 3. Выполним следующее преобразование для полученного на шаге 4 нечеткого
множества α~ . Исключим из рассмотрения классы с малыми значениями степеней увере-
нности
i
µ , заменив α~ его α – срезом:
,
,1
<,0
=
≥ εµ
εµ
µ
если
если
i
(21)
где ε – параметр алгоритма распознавания, соответствующий пороговому значе-
нию.
Шаг 4. Чтобы оценить качество построенной модели введем следующую операцию
приведения к четкости ( )δα ;
~
H , которую будем называть операцией мультиклассового
приведения к четкости с функцией отказа от распознавания:
( )
( ) ( )
∆
−≠∀
иначе
jijiесли
H jlilklll
,
>,,,,,,
=
~ 21
δµµωωω
α
K
,
(22)
где [0,1]∈δ – параметр алгоритма, ∆ – символ отказа от распознавания, 1l –
номер класса образов, степень принадлежности к которому максимальная
jcjmaxl µ1,=1 arg= , 2l – номер класса образов, для которого степень принадлежности
Максимова А.Ю.
«Искусственный интеллект» 2013 № 3 178
3М
максимальная среди оставшихся классов образов jljcjmaxl µ
11,=2 arg=
≠∧
, и так далее,
j
kljcjk ljljmaxl µ
1211,=
arg=
−
≠ ≠∧∧≠∧∧ K
, k – количество классов образов, к
которым алгоритм относит рассматриваемый образец. Если 1>k , то образец x нахо-
дится в области пересечения классов.
4 Результаты экспериментов
Предложенный метод распознавания применяется для решения задач иденти-
фикационной экспертизы в системах экспертного контроля. Под термином «иденти-
фикация» в данном случае не подразумевается общеизвестный математический термин,
а только понятие установления тождественности между реальным объектом и суще-
ственными его характеристиками, заявленными в документации, в целях борьбы с
фальсификациями. К таким задачам относится практическая задача идентификации
производителя бензина [10], для которой проведен ряд экспериментов.
Для оценки качества алгоритма распознавания будем делить выборку прецедентов
на обучающую и тестовую в соотношении 2:1 для каждого класса соответственно.
Для оценки качества алгоритма распознавания используется матрица неточно-
стей Q . Элемент ijq матрицы неточностей определяет количество элементов тестовой
выборки, для которых правильным классом образов является класс
i
ω , а алгоритмом
распознавания он был отнесен к классу .jω В табл. 1 приведен пример матрицы не-
точности для задачи распознавания с двумя классами образов. Искусственно введенный
класс 0ω соответствует отказу от распознавания, как в функции (22).
Таблица 1 − Матрица неточностей
Метод
Модель
0ω
1ω 2ω
1ω 10q
11q 12q
2ω 20q
21q 22q
Пусть
i
p , Ki 1,= – априорная вероятность встречаемости элементов данного
класса для задачи распознавания, 1=
1= i
K
i
p∑ . Вычислим вероятность событий, при
которой алгоритм определил, что объект класса
i
ω является объектом класса jω ,
KjKi 0,=,1,= :
,=
0= ik
K
k
ij
ij
q
q
p
∑
((23)
где ijq – элементы матрицы неточности.
Рассмотрим два типа ошибки для алгоритма с функцией отказа. Первый тип
ошибки будет учитывать только ситуацию, когда алгоритм дал неправильный ответ,
и будет определять вероятность ошибки алгоритма:
∑∑
≠
ij
K
ij
ji
K
i
I
ppA
1=1=
= .
(24)
Метод принятия решения для модели классификации…
«Штучний інтелект» 2013 № 3 179
3М
Вероятность отказов рассчитаем по формуле:
.= 01= i
K
i
qR ∑
(25)
Тогда ошибка второго типа будет включать как неправильный ответ, так и отказ
от распознавания и ее вероятность вычислим как:
RAA
III
+= (26)
Далее в результате экспериментов качество модели оценивается по форму-
лам (24), (25) и (26).
Задача классификации вин. Первая группа экспериментов была выполнена
для бенчмарк-задачи классификации вин, приведенной в [11]. Для каждой пробы вина
известны 13 его характеристик, перечислим некоторые из них: содержание спирта,
яблочной кислоты, флавоноидов и т.д. Даны результаты экспериментов для 178 проб
вина для трех типов вин, для которых известно, из какого сорта винограда они произве-
дены. Необходимо построить модель классификации, по которой можно было бы опре-
делить для неизвестной пробы вина сорт винограда, из которого оно произведено.
Алфавит классов образов для данной задачи распознавания состоит из трех
элементов 3}V2,V1,V{=Ω , количество информативных признаков 13=m .
В табл. 2 приведены значения критериев (12) XBv и (9) PCv .
Таблица 2 − Значение критериев адекватности для задачи классификации вин
с 1V,XBv 1V,XBv 1V,XBv 1V,PCv 2V,PCv 3V,PCv
1 – – – 1 1 1
2 11.47 27.88 8.75 0.51 0.50 0.52
3 59.12 124.25 43.36 0.34 0.34 0.36
4 308.73 438.12 104.95 0.25 0.25 0.27
Результат работы алгоритма при 0.01=δ 5,79%==
III
AA на тестовой выбо-
рке и 0.69%=
I
A , 1.52%=
II
A на обучающей выборке в предположении, что классы
встречаются с равной априорной вероятностью
3
1
=== 321 VVV ppp .
Результаты других исследовании для задачи классификации вин находятся в пре-
делах 0% – 10% и указывают на то, что классы образов сильно пересекаются [11].
Таким образом, полученный результат подтверждает эффективность предложенного
алгоритма.
Выполним анализ значений коэффициентов адекватности, приведенных в табл. 2.
Минимальное значение XBv для всех трех классов достигается при 2=с , а значение
критерия
c
vPC
1
≈ , что соответствует «предельно нечеткому разбиению», U , что было
рассмотрено при описании свойств во второй части статьи. Таким образом, можно сде-
лать вывод, что классы образов для данной задачи не имеют внутренней структуры, 1=c .
Также значение XBv для 2V при 2=c больше, в сравнении со значением дан-
ного критерия для классов 1V и 3V , что соответствует тому факту, что алгоритм распоз-
навания ошибался именно на представителях класса 2V .
Задача идентификации производителя бензина. Данная практическая задача
возникает в лабораториях контроля качества нефтепродуктов при их реализации и на-
правлена на борьбу с фальсификациями топлива. В качестве классов образов выступает
бензин определенного производителя и определенной марки, а информативными призна-
Максимова А.Ю.
«Искусственный интеллект» 2013 № 3 180
3М
ками являются физико-химические показатели образца. Предложенный метод распо-
знавания используется в автоматизированной системе идентификации нефтепродуктов,
разработанной для компании ООО «Параллель-М ЛТД».
Значение ошибки первого типа для обучающих выборок за разные периоды не
выше 4%, а ошибки второго типа не выше 12%. Такой показатель обусловлен тем,
что классы сильно пересекаются.
Выводы
В данной статье предложен новый алгоритм распознавания для решения задачи
в условиях неопределенности, который может быть использован при разработке откры-
тых систем распознавания. Представление результата работы алгоритма распознавания
в виде нечеткого множества, описывающего степень похожести объекта на каждый
класс образов, позволяет решить проблему неопределенности.
Предложенный алгоритм разработан и апробирован на задачах идентификацион-
ной экспертизы. Для этих задач актуальны основные преимущества метода: прозрачность
модели и возможность расширять модели при появлении новых данных.
Литература
1. Воронцов К.В. Комбинаторный подход к оценке качества обучаемых алгоритмов / К.В. Ворон-
цов // Математические вопросы кибернетики. – 2004. – № 13. – М. : Физматлит, 2004. – С. 5-36.
2. Kuncheva L.I. Fuzzy Classifier Design / Kincheva L.I. – Springer Verlag, 2000. – 315 p.
3. Ishibuchi H. Classification and Modeling with Linguistic Information Granules / H. Ishibuchi,
T. Nakashima, M. Nii. – Spriger, 2005. – 307 p.
4. Сергиенко Р.Б. Коэволюционный генетический алгоритм решения сложных задач условной
оптимизации / Р.Б. Сергиенко, Е.С. Семенкин // Вестник Сибирского государственного
аэрокосмического университета имени академика М.Ф. Решетнёва. – № 2 (23). – 2009. – С. 17-21.
5. Chen N. Fuzzy Classification Using Self-Organizing Map and Learning Vector Quantization / N. Chen //
CASDMKM 2004. Lecture Notes in Artificial Intelligence. – Springer-Verlag, 2004. – V. 3327. –
P. 41-50.
6. Fuzzy Models and Algorithms for Pattern Recognition and Image Processing / [J.C. Bezdek, J. Keller,
R. Krisnapuram, R. Pal]. – New York : Springer Verlag, 2005. – 785 p.
7. Handbook of Granular Computing / W. Pedrycz, A. Skowron, V. Kreinovich, [eds.]. – N.-Y. : John Wiley
& Sons,2007. – 1116 p.
8. Pal N. On Cluster Validity for the Fuzzy c-Means Model / N. Pal, J. Bezdek // IEEE Transactions on
Fuzzy System. – 1995. – V. 3, № 3. – P. 370-379.
9. Maksimova A. The Model of Data Presentation with Fuzzy Portraits for Pattern Recognition /
A. Maksimova // International Journal of Computing. – 2012. – Vol. 11, Issue 1. – P. 17-24.
10. Козловский В.А. Нечеткая система распознавания образов для решения задач классификации
жидких нефтепродуктов / В.А. Козловский, А.Ю. Максимова // Наукові праці ДонНТУ, Серія
«Інформатика, кібернетика та обчислювальна техніка». – 2011. – №13 (185). – С. 200-205.
11. Frank A. UCI Machine Learning Repository. Wine Data Set. / A. Frank, Asuncion Irvine C.A.
[Электронный ресур]. – University of California, School of Information and Computer Science. –
2010. – Режим доступа : [http://archive.ics.uci.edu/ml/ datasets/Wine].
Literatura
1. Vorontsov K.V. Сombinatorial approach to evaluating the quality of training algorithms /
K.V. Vorontsov // Mathematical Problems of Cybernetics. - 2004. - № 13 - Moscow: Fizmatlit, 2004. –
P. 5-36.
2. Kuncheva L. I. Fuzzy Classifier Design / Kincheva L.I. – Springer Verlag, 2000. – 315 p.
3. Ishibuchi H. Classification and Modeling with Linguistic Information Granules / H. Ishibuchi,
T. Nakashima, M. Nii. – Spriger, 2005. – 307 p.
Метод принятия решения для модели классификации…
«Штучний інтелект» 2013 № 3 181
3М
4. Sergienko R.B. Co-evolutionary genetic algorithm to solve complex constrained optimization problems /
R.B. Sergienko, E.S. Semenkin // Bulletin of the Siberian State Aerospace University named after
Academician M.F. Reshetnev. – № 2 (23). – 2009. – P. 17-21.
5. Chen N. Fuzzy Classification Using Self-Organizing Map and Learning Vector Quantization / N.Chen //
CASDMKM 2004. Lecture Notes in Artificial Intelligence. – V. 3327. – Springer-Verlag, 2004. –
P. 41-50.
6. Bezdek J.C. Fuzzy Models and Algorithms for Pattern Recognition and Image Processing / J.C. Bezdek,
J. Keller, R. Krisnapuram, R. Pal. – New York : Springer Verlag, 2005. – 785 p.
7. Handbook of Granular Computing / W. Pedrycz, A. Skowron, V. Kreinovich, [eds.]. – N.-Y. : John Wiley
& Sons,2007. – 1116 p.
8. Pal N. On Cluster Validity for the Fuzzy c-Means Model / N. Pal, J. Bezdek // IEEE Transactions on
Fuzzy System. – 1995. – V. 3, № 3. – P. 370-379.
9. Maksimova A. The Model of Data Presentation with Fuzzy Portraits for Pattern Recognition /
A. Maksimova // International Journal of Computing. – 2012. – Vol. 11, Issue 1. – P. 17-24.
10. Kozlowskyj V.A. Fuzzy pattern recognition system to solve the problems of liquid petrolium
classification / V.A. Kozlowskyj, A. Yu. Maksymova // Proceedings of Donetsk National Technical
University, Series «Informatics, Cybernetics and Computer Science». – 2011. – № 13 (185). –
S. 200-205.
11. Frank. A. UCI Machine Learning Repository. Wine Data Set / A. Frank, Asuncion Irvine C.A. –
University of California, School of Information and Computer Science. 2010. – [http://archive.ics.
uci.edu/ml/ datasets/Wine].
RESUME
A. Maksymova
Decision Making Method for Classifying Models Based
on Intra-class Clustering on FCM-algorithm
This paper deals with pattern recognition method in conditions of uncertainty for
open recognition systems. Decision support systems for identification examination are
example of such systems, we discuss here.
The formally formulation of the problem is presented. An algorithm for intra-class
clustering based on FCM-algorithm is worked out. The Xie-Beni index is used to solve
problem of searching optimal number of clusters.
An algorithm for decision making is worked out. This algorithm calculates the
membership degrees of recognizable object using the distances to prototypes of clusters.
The function of multiclass defuzzyfication with rejection option is introduced, that allows
to take into account the uncertainty of the result of the decision.
The experiments confirmed the effectiveness of the method on reference problem of
wine classification and on the petroleum identification problem. The work results are used
in automated system for liquid petroleum checking.
Статья поступила в редакцию 10.06.2013.
|
| id | nasplib_isofts_kiev_ua-123456789-85165 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-11-30T18:29:47Z |
| publishDate | 2013 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Максимова, А.Ю. 2015-07-21T11:49:30Z 2015-07-21T11:49:30Z 2013 Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом / А.Ю. Максимова // Искусственный интеллект. — 2013. — № 3. — С. 171–181. — Бібліогр.: 11 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/85165 004.891:004.827:004.931 В статье предложен метод распознавания образов для задач с сильно пересекающимися классами образов. В рамках метода реализован алгоритм поиска оптимального в соответствии с некоторым критерием адекватности числа кластеров FCM-алгоритма и построена модель, описывающая структуру данных задачи распознавания, а также предложен метод принятия решения по этой модели. У статті запропоновано метод розпізнавання образів для задач з класами образів, що сильно перетинаються. У рамках методу реалізовано алгоритм пошуку оптимального відповідно з деяким критерієм адекватності числа кластерів FCM-алгоритму і побудовано модель, що описує структуру даних задачі розпізнавання, а також запропоновано метод прийняття рішення за цією моделлю. In this paper we propose a method for pattern recognition problems with strongly overlapping classes of images. The method for optimal according to some validation measure number of clusters for FCMalgorithm is implemented. The classification model that describes the data structure for pattern recognition problem and the decision making method for this model are proposed. ru Інститут проблем штучного інтелекту МОН України та НАН України Искусственный интеллект Анализ и синтез коммуникационной информации Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом Метод прийняття рішень для моделі класифікації, що заснована на внутрікласової кластеризації FCM-алгоритмом Decision making method for classifying models based on intra-class clustering on FCM-algorithm Article published earlier |
| spellingShingle | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом Максимова, А.Ю. Анализ и синтез коммуникационной информации |
| title | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом |
| title_alt | Метод прийняття рішень для моделі класифікації, що заснована на внутрікласової кластеризації FCM-алгоритмом Decision making method for classifying models based on intra-class clustering on FCM-algorithm |
| title_full | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом |
| title_fullStr | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом |
| title_full_unstemmed | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом |
| title_short | Метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации FCM-алгоритмом |
| title_sort | метод принятия решения для модели классификации, построенной на основе внутриклассовой кластеризации fcm-алгоритмом |
| topic | Анализ и синтез коммуникационной информации |
| topic_facet | Анализ и синтез коммуникационной информации |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/85165 |
| work_keys_str_mv | AT maksimovaaû metodprinâtiârešeniâdlâmodeliklassifikaciipostroennoinaosnovevnutriklassovoiklasterizaciifcmalgoritmom AT maksimovaaû metodpriinâttâríšenʹdlâmodelíklasifíkacííŝozasnovananavnutríklasovoíklasterizacíífcmalgoritmom AT maksimovaaû decisionmakingmethodforclassifyingmodelsbasedonintraclassclusteringonfcmalgorithm |