Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных
В статье предложен алгоритм гибридной нечеткой кластеризации mdsFCM, который благодаря применению неевклидовых метрик, вычисление которых основано на использовании матрицы ковариации, обладает более высокой чувствительностью при обработке многомерных данных. Представлены экспериментальные результаты...
Збережено в:
| Опубліковано в: : | Штучний інтелект |
|---|---|
| Дата: | 2012 |
| Автори: | , |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2012
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/57898 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных / Л.Г. Ахметшина, А.А. Егоров // Штучний інтелект. — 2012. — № 4. — С. 535-545. — Бібліогр.: 8 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-57898 |
|---|---|
| record_format |
dspace |
| spelling |
Ахметшина, Л.Г. Егоров, А.А. 2014-03-15T18:03:54Z 2014-03-15T18:03:54Z 2012 Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных / Л.Г. Ахметшина, А.А. Егоров // Штучний інтелект. — 2012. — № 4. — С. 535-545. — Бібліогр.: 8 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/57898 004.93 В статье предложен алгоритм гибридной нечеткой кластеризации mdsFCM, который благодаря применению неевклидовых метрик, вычисление которых основано на использовании матрицы ковариации, обладает более высокой чувствительностью при обработке многомерных данных. Представлены экспериментальные результаты применения предложенного алгоритма для кластеризации низкоконтрастных цветных медицинских изображений. У статті запропоновано алгоритм гібридної нечіткої кластеризації mdsFCM, який завдяки застосуванню неевклідових метрик, заснованих на використанні матриці коваріації, має більш високий рівень чутливості при обробці багатовимірних даних. Представлені експериментальні результати застосування запропонованого алгоритму для кластеризації низькоконтрастних кольорових медичних зображень. This article deals with the description of the hybrid fuzzy clustering algorithm mdsFCM, which is used non-Euclidian distances based on calculation the covariance matrix. This algorithm has the greater level of sensitivity while processing multidimensional data. The experimental results of the application of the proposed algorithm for low-contrast medical color images clustering are shown. ru Інститут проблем штучного інтелекту МОН України та НАН України Штучний інтелект Нейронные сети и нейросетевые технологии. Информационная безопасность ИС Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных Вплив виду міри відстані на чутливість нейро-фаззі кластеризації багатовимірних даних Influence of the Type of Distance Measure on Sensitivity of Neuro-Fuzzy Clustering for Multidimensional Data Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| spellingShingle |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных Ахметшина, Л.Г. Егоров, А.А. Нейронные сети и нейросетевые технологии. Информационная безопасность ИС |
| title_short |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| title_full |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| title_fullStr |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| title_full_unstemmed |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| title_sort |
влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных |
| author |
Ахметшина, Л.Г. Егоров, А.А. |
| author_facet |
Ахметшина, Л.Г. Егоров, А.А. |
| topic |
Нейронные сети и нейросетевые технологии. Информационная безопасность ИС |
| topic_facet |
Нейронные сети и нейросетевые технологии. Информационная безопасность ИС |
| publishDate |
2012 |
| language |
Russian |
| container_title |
Штучний інтелект |
| publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
| format |
Article |
| title_alt |
Вплив виду міри відстані на чутливість нейро-фаззі кластеризації багатовимірних даних Influence of the Type of Distance Measure on Sensitivity of Neuro-Fuzzy Clustering for Multidimensional Data |
| description |
В статье предложен алгоритм гибридной нечеткой кластеризации mdsFCM, который благодаря применению неевклидовых метрик, вычисление которых основано на использовании матрицы ковариации, обладает более высокой чувствительностью при обработке многомерных данных. Представлены экспериментальные результаты применения предложенного алгоритма для кластеризации низкоконтрастных цветных медицинских изображений.
У статті запропоновано алгоритм гібридної нечіткої кластеризації mdsFCM, який завдяки застосуванню неевклідових метрик, заснованих на використанні матриці коваріації, має більш високий рівень чутливості при обробці багатовимірних даних. Представлені експериментальні результати застосування запропонованого алгоритму для кластеризації низькоконтрастних кольорових медичних зображень.
This article deals with the description of the hybrid fuzzy clustering algorithm mdsFCM, which is used non-Euclidian distances based on calculation the covariance matrix. This algorithm has the greater level of sensitivity while processing multidimensional data. The experimental results of the application of the proposed algorithm for low-contrast medical color images clustering are shown.
|
| issn |
1561-5359 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/57898 |
| citation_txt |
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации многомерных данных / Л.Г. Ахметшина, А.А. Егоров // Штучний інтелект. — 2012. — № 4. — С. 535-545. — Бібліогр.: 8 назв. — рос. |
| work_keys_str_mv |
AT ahmetšinalg vliânievidameryrasstoâniânačuvstvitelʹnostʹneirofazziklasterizaciimnogomernyhdannyh AT egorovaa vliânievidameryrasstoâniânačuvstvitelʹnostʹneirofazziklasterizaciimnogomernyhdannyh AT ahmetšinalg vplivvidumírivídstanínačutlivístʹneirofazzíklasterizacííbagatovimírnihdanih AT egorovaa vplivvidumírivídstanínačutlivístʹneirofazzíklasterizacííbagatovimírnihdanih AT ahmetšinalg influenceofthetypeofdistancemeasureonsensitivityofneurofuzzyclusteringformultidimensionaldata AT egorovaa influenceofthetypeofdistancemeasureonsensitivityofneurofuzzyclusteringformultidimensionaldata |
| first_indexed |
2025-11-25T09:02:07Z |
| last_indexed |
2025-11-25T09:02:07Z |
| _version_ |
1850508668821307392 |
| fulltext |
«Штучний інтелект» 4’2012 535
7А
УДК 004.93
Л.Г. Ахметшина, А.А. Егоров
Днепропетровский национальный университет им. О. Гончара,
г. Днепропетровск, Украина
Украина, г. Днепропетровск, ул. Научная, 13, akhmlu@mail.ru, egorov@mayak.dp.ua
Влияние вида меры расстояния на чувствительность
нейро-фаззи кластеризации многомерных данных
L.G. Akhmetshina, A.A. Yegorov
Dnepropetrovsk National University named after O. Gonchar,
c. Dnepropetrovsk, Ukraine
Ukraine, c. Dnepropetrovsk,Naukova st., 13 akhmlu@mail.ru, egorov@mayak.dp.ua
Influence of the Type of Distance Measure on Sensitivity
of Neuro-Fuzzy Clustering for Multidimensional Data
Л.Г. Ахметшина, А.О. Єгоров
Дніпропетровський національний університет ім. О. Гончара,
м. Дніпропетровськ, Україна
Україна, м. Дніпропетровськ, вул. Наукова, 13, akhmlu@mail.ru, egorov@mayak.dp.ua
Вплив виду міри відстані на чутливість
нейро-фаззі кластеризації багатовимірних даних
В статье предложен алгоритм гибридной нечеткой кластеризации mdsFCM, который благодаря применению
неевклидовых метрик, вычисление которых основано на использовании матрицы ковариации, обладает
более высокой чувствительностью при обработке многомерных данных. Представлены эксперимен-
тальные результаты применения предложенного алгоритма для кластеризации низкоконтрастных цветных
медицинских изображений.
Ключевые слова: многомерные изображения, нейро-фаззи кластеризация, меры расстояний,
сегментация, неевклидовые метрики.
This article deals with the description of the hybrid fuzzy clustering algorithm mdsFCM, which is used non-
Euclidian distances based on calculation the covariance matrix. This algorithm has the greater level of sensitivity
while processing multidimensional data. The experimental results of the application of the proposed algorithm
for low-contrast medical color images clustering are shown.
Key words: multidimensional images, neuro-fuzzy clustering, distance measures, segmentation,
non-Euclidean metrics.
У статті запропоновано алгоритм гібридної нечіткої кластеризації mdsFCM, який завдяки застосуванню
неевклідових метрик, заснованих на використанні матриці коваріації, має більш високий рівень чутливості
при обробці багатовимірних даних. Представлені експериментальні результати застосування запропо-
нованого алгоритму для кластеризації низькоконтрастних кольорових медичних зображень.
Ключові слова: багатовимірні зображення, нейро-фаззі кластеризація, міри відстані, сегмен-
тація, неевклідові метрики.
Введение
Выполнение кластеризации в том или ином виде часто является неотъемлемой
составляющей современных систем обработки и анализа данных. Несмотря на то, что
Ахметшина Л.Г., Егоров А.А.
«Искусственный интеллект» 4’2012 536
7А
для решения этой задачи разработано множество методов, они не обладают универ-
сальностью, и их эффективность существенно зависит от специфики исходных данных.
В настоящее время при обработке данных приходится сталкиваться с такими
серьезными проблемами:
– большие объемы выборок;
– отсутствие априорных сведений о скрытых в них зависимостях;
– большое количество информативных признаков исследуемых объектов.
Таким образом, используемые алгоритмы кластеризации, с одной стороны, должны
быть достаточно эффективны с точки зрения быстродействия, а с другой уметь обна-
руживать неизвестные закономерности без длительной процедуры настройки, а также
эффективно использовать множество информативных признаков исследуемых объектов.
Достаточно часто для решения задачи кластеризации применяются нечеткие или
нейросетевые алгоритмы. В первом случае зачастую используется алгоритм FCM
(Fuzzy c-means) [1] по причине относительной простоты и достаточной для многих
задач чувствительности. Среди нейросетевых алгоритмов особый интерес представляют
сети, обучаемые без учителя, т.к. они не требуют длительной процедуры настройки,
в частности, самоорганизующаяся карта Кохонена (SOM), которая отличается прос-
тотой архитектуры и относительно высоким быстродействием [2].
В последнее время популярным является нейро-фаззи подход, который пред-
полагает объединение алгоритма нечеткой кластеризации и нейронной сети в пределах
одного метода, что позволяет повысить чувствительность или быстродействие. В ка-
честве примера, реализующего такой подход, можно привести алгоритм гибридной
нечеткой кластеризации sFCM [3], [4].
Все вышеперечисленные алгоритмы могут применяться для обработки одномер-
ных и многомерных данных с сопоставимой эффективностью, а следовательно, не
используют специфику объектов, имеющих множество информативных признаков.
Существуют алгоритмы нечеткой кластеризации, позволяющие учитывать осо-
бенности многомерных данных за счет применения неевклидовых метрик, основанных
на вычислении матрицы ковариации Густафсона-Кесселя и FMLE (Fuzzy Maximum
Length Estimates) [5]. Причем применение их для одномерного случая сопоставимо
по эффективности с алгоритмом FCM, однако требует больших вычислительных затрат
при обработке многомерных данных.
Постановка задачи
Интерес представляет использование в рамках нейро-фаззи подхода нечеткого
алгоритма, основанного на применении неевклидовых расстояний.
Таким образом, целью данной статьи является повышение чувствительности
нечеткой кластеризации многомерных данных за счет применения в алгоритме sFCM
матрицы неевклидовых расстояний.
Решение задачи
Предложенный метод гибридной нечеткой кластеризации многомерных данных
mdsFCM состоит из одиннадцати шагов.
1. Инициализация числа кластеров c , значения m (экспоненциальный вес не-
четкой кластеризации), начальных значений центров нечетких классов 0
fcmv .
2. Формирование начальных значений весов нейронов SOM, на основании зна-
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации...
«Штучний інтелект» 4’2012 537
7А
чений из матрицы центров нечетких кластеров предыдущей итерации 1t
fcmv , количе-
ство которых выбирается равным ]1,c*N[ e (одномерная структура столбец), где
eN коэффициент увеличения числа нечетких кластеров c . Каждое новое значение
матрицы 1t
fcmv вычисляется методом пропорционального распределения [6].
3. Кластеризация исходных данных с помощью SOM, происходящая в два этапа:
грубая и тонкая настройка весов нейронов. При этом выполняется динамическое умень-
шение количества нейронов, которое осуществляется следующим образом:
3.1. инициализация управляющих параметров нейронной сети:
– вектор радиусов влияния каждого нейрона должен содержать натуральные числа
от значения 0
1r до 1. При этом:
e
0
n
0
1 N/Nr , (1)
e
f
n
0
1 N,cmax/Nr , (2)
где 0
nN и f
nN начальные количества нейронов для фаз грубой и тонкой на-
строек соответственно;
– количество шагов обучения maxs равно длине вектора радиусов;
3.2. вычисление параметра, ограничивающего сжатие:
0
max2 /5.00
maxmax
p
pp
, (3)
0
min
00
max / nn NNp , (4)
где min
0
nN количество нейронов после предварительного сжатия, выполняе-
мого согласно пунктам 6.1 – 6.5, 6.8, 6.9; 0*2/ nc NcN , а минимально допустимое
число нейронов cc min .
3.3. шаг обучения SOM:
3.3.1. попытка уменьшения числа нейронов, если maxmax ps/s ,
где maxs,...,1s номер текущей итерации обучения; 0
n
max
c
N*2
p*cN ,
max
0
nmin s/s1*cNcc . (5)
Применение выражения (5) позволяет ограничить уровень сжатия количества
нейронов в зависимости от номера итерации;
3.3.2. при уменьшении числа нейронов вычисляется максимальное значение
радиуса влияния текущей итерации ir1 по формуле
2s
n
1s
n
s
n
1s
1
s
1 NN/N*r*2r , (6)
где 1s
1r
максимальное значение радиуса влияния каждого нейрона на преды-
дущей итерации; 1s
nN и 2s
nN количества нейронов на двух предыдущих итерациях
Ахметшина Л.Г., Егоров А.А.
«Искусственный интеллект» 4’2012 538
7А
соответственно, причем первоначальные значения этих параметров 0
n
2s
n
1s
n NNN ;
3.3.3. вычисление разности max
s
1
1s
11 s,...2s,1rrr . Если 01 r ,
то номер текущей итерации увеличивается на значение 1r ;
3.3.4. на основе Евклидовых расстояний для каждого экземпляра исходных дан-
ных определяется нейрон-победитель;
3.3.5. модификация весов нейронов-победителей и соседних с ними нейронов,
определяемых на основе функции соседства;
3.3.6. если maxss , то переход к пункту 3.3.1.
4. Получение новых значений центров нечетких кластеров t
somv путем выбора
c значимых центров из матрицы весов нейронов, полученной в результате обучения
SOM. Этот выбор является нетривиальной задачей и оказывает влияние на чувстви-
тельность метода.
5. Вычисление текущих значений функции принадлежности tu :
ni
ck
D
D
u
c
L
m
Li
kit
ik ,...,1
,,...,1
1
1
2
,
,
, , (7)
где n число экземпляров данных, а D матрица расстояний между экземп-
лярами исходных данных X и центрами нечетких кластеров, которая вычисляется
по следующей формуле:
c,...,1k,n,...,1i,vX*A*vXD k
t
somi
T
k
t
somik,i , (8)
причем c,...,1k,AA t
k . Следует отметить, что способ формирования мат-
риц t
kA влияет на чувствительность кластеризации.
6. Динамическое сжатие функции принадлежности на основе расстояний между
центрами нечетких кластеров происходит итеративно по следующему алгоритму:
6.1. определение матрицы расстояний в q-мерном пространстве между центрами
нечетких кластеров 0d и значений минимального ненулевого 0
mind и максимального
0
maxd расстояний;
6.2. автоматическое определение минимально допустимых расстояний между
центрами кластеров 1
ad и 2
ad . Расстояние 1
ad определяется на основе статистических
характеристик матрицы 0d следующим образом:
6.2.1. рассчитывается начальное значение расстояния 1
ad по формуле:
0
d
n
1j
0
j
0
c
0
c0
1
a n/dddd
0
d
, (9)
причем )d*5.0,dmin(d 0
max
00
c , где 0d среднее по матрице 0d .
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации...
«Штучний інтелект» 4’2012 539
7А
6.2.2. если не существует элементов 0
id матрицы 0d , удовлетворяющих условию:
0L,n/dddd 1L
d
n
1j
0
j
1L
c
1L
c
0
i
1L
d
, (10)
где
)dmax(*5.0,dmind 1L1L1L
c , причем 1Ld среднее по вектору
1Ld , который состоит из 1L
dn элементов 0
id матрицы 0d , удовлетворяющих
условию (10), то выход;
6.2.3. рассчитывается текущее значение расстояния 1
ad по формуле:
0L,n/dddd L
d
n
1i
L
i
L
c
L
cL
1
a
L
d
, (11)
где L
cd вычисляется аналогично значению 1L
cd ;
6.2.4. если условие:
L
c
1L
c
L
d
1L
d d/dn/n , (12)
выполнилось на предыдущем шаге (кроме 1-го), то выход;
6.2.5. переход к пункту 6.2.2.
Если выход из вышерассмотренного алгоритма произошел из-за невыполнения
условия (10), и количество итераций было не менее 2, то расстояние 1
ad вычисляется
по следующей формуле:
1L
1
addL
1
add
1
a d*k1,kmind*k1,kmaxd
cccc , (13)
причем 1L
c
L
cd d/dk
c
.
Расстояние 2
ad вычисляется на основе изменения производной [4].
6.3. Выбор минимального mind из расстояний 1
ad , 2
ad и ud , что позволяет
избежать негативного влияния от использования слишком большого значения пара-
метра cN (если 1,0cN , то, как правило, выбирается 1
ad или 2
ad ). Значение ud вы-
числяется по формуле:
0
max
0
min
0
min
0
min d/d,dmin*d1sqn10
minc
0
u dN*dd
, (14)
где cN параметр, задаваемый в ручном режиме и используемый для регули-
рования степени сжатия, который может изменяться от 0 до 1; 0d среднее по
значениям 0d текущего и первого шагов алгоритма, причем 0
min
0
max
0 ddd ;
6.4. если 0min d или не существует расстояния между двумя нечеткими клас-
терами, меньшего mind , то переход к пункту 6.9;
Ахметшина Л.Г., Егоров А.А.
«Искусственный интеллект» 4’2012 540
7А
6.5. изменение каждого центра кластера, отличного от двух выбранных:
)(*)1(* dd
t
fcmdk
t
fcmk
t
fcm vvv , (15)
skdkdd kdsdd ,,/ ,
0
,
0 , (16)
где sd , индексы выбранных для сжатия удаляемого и модифицируемого цент-
ров соответственно; sdd ,
0 расстояние между выбранными центрами; jdd ,
0
расстояние между удаляемым и одним из оставшихся центров. По формуле (15)
модифицируются и центры 1t
fcmv ;
6.6. изменение функции принадлежности iku , к каждому из кластеров для каж-
дого из векторов исходных данных:
)(*),1(*max ,,, diddikik uuu , (17)
где idu , функция принадлежности к удаляемому кластеру;
6.7. изменение функции принадлежности (путем выполнения нечеткой операции
объединения) для двух выбранных центров кластеров, которое отображается для моди-
фицируемого центра, и сжатие путем отбрасывания функций принадлежности удаляе-
мого кластера;
6.8. преобразование центров t
somv и 1t
fcmv в соответствии с пунктом 6.7, причем
изменение модифицируемого центра кластера происходит с помощью усреднения;
6.9. если количество нечетких кластеров, полученных после сжатия, больше, чем
minc (как правило, равно 2), то переход к пункту 6.1, а иначе к пункту 6.10;
6.10. масштабирование полученной после сжатия функции принадлежности к не-
четким кластерам для каждого экземпляра исходных данных, чтобы удовлетворялось
условие 1
1
,
c
k
iku .
7. Формирование матрицы центров нечетких кластеров t
fcmv , которые будут ис-
пользованы в начале следующей итерации:
n
i
m
ik
n
i
ji
m
ikjk
t
fcm uXuv
1
,
1
,,, /)( . (18)
8. Вычисление значения t
v среднего по матрице расстояний между центрами
нечетких кластеров t
fcmv и 1t
fcmv , а также критериев t
xbV и t
fzV , которые являются
показателями Ксие-Биени и нечеткости текущей итерации соответственно, следующим
образом [5]:
2
min
c
1k
n
1i
q
1j
2
j,k
t
fcmj,i
mt
i,k
t
xb d*n/vX*uV
, (19)
n/uV
c
1k
n
1i
2t
i,k
t
fz
, (20)
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации...
«Штучний інтелект» 4’2012 541
7А
где mind минимальное Евклидово расстояние между центрами нечетких
кластеров.
9. Если выполняется условие max
fz
t
fz CC , причем t
xb
t
fz
t
fz V/VC , а max
fzC
максимальный из коэффициентов t
fzC , то запоминаются следующие значения:
t
v
max
v , t
fz
max
fz CC , tmax uu и t
fcm
max
fcm vv .
10. Если выполняется условие:
t
v или ( 1t
xb
t
xb VV и 1t
fz
t
fz VV ), (21)
где пороговое значение, а t
xbV , 1t
xbV и t
fzV , 1t
fzV показатели Ксие-Биени
и нечеткости текущей и предыдущей итераций соответственно, которые вычисляются
по следующим формулам, то осуществляется переход к пункту 2.
11. Если выполняется условие:
max
fz
t
fz CC и ( max
v
t
v или ( max
v
t
v и cpp
v
)), (22)
причем
min
fz
max
fz
max
fz
t
fz
max
fz
t
fz
c
CC
1*
)C,Cmax(
CC
p
, (23)
min
v
'max
v
max
v
t
v
max
v
t
v 1*
),max(
p
v
, (24)
где min
fzC и min
v минимальные значения параметров t
fzC и t
v соответственно,
а 'max
v максимальное значение критерия t
v , то происходит возврат к сохраненным
значениям матриц нечеткой функции принадлежностей maxu и центров нечетких клас-
теров max
fcmv , которые и являются результатом обучения.
Способ формирования матрицы t
kA перед применением формулы (8) оказывает
влияние на чувствительность кластеризации. С учетом обработки многомерных данных
t
kA формируются на основе матрицы ковариации. В этой работе рассматриваются
два подхода к вычислению этих матриц:
1. с применением нечеткой матрицы ковариации. При этом каждая из матриц
t
kA вычисляется по формуле:
1t
k
q/1t
kk
t
k F*Fdet*A
, (25)
где k константа, отражающая знания о данных, подлежащих группированию
(если таких знаний до начала кластеризации нет, то c,...,1k,1k ), а t
kF так
Ахметшина Л.Г., Егоров А.А.
«Искусственный интеллект» 4’2012 542
7А
называемая нечеткая матрица ковариации k-й группы формируется следующим
образом:
c,...,1k,
u
vXvXu
F n
1i
m
k,i
t
som
n
1i
T
k
t
somik
t
somi
m
k,i
t
som
t
k
, (26)
причем t
somu вычисляется по формуле (7), при использовании которой форми-
рование матриц t
kF , необходимых для получения t
kA , осуществляется по формуле:
c,...,1k,vXvXF
n
1i
T
k
t
somik
t
somi
t
k
. (27)
При этом 0u вычисляется по формуле (8) с использованием матриц 0v и IA ;
2. на основе стандартной матрицы ковариации. При этом t
k
t
k FA , а матрицы
t
kF вычисляются по формуле (27), но вместо t
somv используется вектор, составленный
из средних значений по каждому информативному признаку исходных данных.
Экспериментальные результаты были получены при обработке различных
цветных низкоконтрастных изображений, в том числе медицинских, примером которых
служат RGB снимки, приведенные на рис. 1 а) и 2 а), представляющие собой резуль-
таты дерматоскопии с целью диагностирования меланомы по визуальным признакам,
среди которых основными являются наличие бело-синих структур и пятен непра-
вильной формы.
а) б) в)
г) д) е)
Рисунок 1 – Кластеризация цветного медицинского изображения: а) исходный
снимок (330×214 пикселей); фрагмент результатов обработки методами: б) sFCM;
mdsFCM с применением: в) нечеткой и г) стандартной матриц ковариации;
д) FCM с применением неевклидовых расстояний, 6c ; е) Густафсона-Кесселя, 4c
При кластеризации приведенных на рис. 1 а) и 2 а) изображений использова-
лись следующие значения управляющих параметров: 20c (для алгоритмов sFCM
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации...
«Штучний інтелект» 4’2012 543
7А
и mdsFCM); 5Ne (рекомендуемые значения 5 или 6, а допустимые значения
целые числа от 2 до 8); после применения карты Кохонена выбирались центры клас-
теров с максимальным количеством относящихся к ним (имеющих минимальное Евкли-
дово расстояние) векторов исходных данных; 5,0cN ; сжатие выполнялось на основе
матриц взвешенных Евклидовых расстояний [7] (рис. 1 а) и расстояний Махалано-
биса (рис. 2 а). Визуализация результатов нечеткой кластеризации производилась ме-
тодом сравнения с исходными данными на основе максимального соответствия [8].
а) б)
в) г)
д) е)
Рисунок 2 – Кластеризация цветного медицинского изображения: а) исходный
снимок (323×215 пикселей); результаты обработки методами: б) sFCM; mdsFCM
с применением: в) нечеткой и г) стандартной матриц ковариации; д) FCM
с применением неевклидовых расстояний, 13c ; е) Густафсона-Кесселя, 8c
На изображении, представленном на рис. 1 а), звездочками отмечены области,
содержащие очаги меланомы. Применение метода sFCM (рис. 1 б) не приводит к их
выделению, в то время как использование алгоритма mdsFCM (рис. 1 в, г) позволяет
успешно справиться с этой задачей. При этом очаги меланомы выделяются четче в
случае применения стандартной матрицы ковариации (рис. 1 в). На рис. 1 д) и 1 е)
приведены результаты применения методов FCM с использованием неевклидовых
расстояний, вычисляемых на основе стандартной матрицы ковариации, и алгоритма
Густафсона-Кесселя соответственно. При этом количества кластеров 6c (рис. 1 д)
и 4c (рис. 1 е) соответствуют результатам сжатия для изображений на рис. 1 в) и 1 г).
Очевидно, что изображения на рис. 1 д) и 1 е) не обеспечивают четкости выделения
очагов меланомы, достаточной для ее однозначного диагностирования.
Ахметшина Л.Г., Егоров А.А.
«Искусственный интеллект» 4’2012 544
7А
На изображении, представленном на рис. 2 а), в области, обведенной прямоуголь-
ником, содержатся плохо различимые на исходном снимке бело-синие структуры.
Применение как метода sFCM (рис. 2 б), так и алгоритма mdsFCM (рис. 2 в, г) поз-
воляет выполнить визуальное диагностирование. При этом метод mdsFCM в обоих
случаях позволяет четче выделить цвета в области интереса, что особенно заметно в ее
нижней части. За счет улучшения цветопередачи и более четкого выделения струк-
туры снимка появляется возможность повышения точности диагностирования области
распространения меланомы. Следует отметить, что из-за черно-белой печати бело-
синие структуры в области интереса представляются оттенками серого: черный цвет
соответствует темно-синему, а светло-серый светло-голубому. На рис. 2 д) и 2 е)
приведены результаты применения методов FCM с использованием неевклидовых
расстояний, вычисление которых основано на стандартной матрице ковариации, и
алгоритма Густафсона-Кесселя при 13c и 8c соответственно. Очевидно, что изо-
бражения на рис. 2 д) и 2 е) не обеспечивают четкого выявления области распрост-
ранения меланомы.
Уменьшение количества нечетких кластеров для алгоритма sFCM приводит к
более существенному снижению чувствительности, чем для mdsFCM. Одним из
примеров экспериментального подтверждения этого факта может служить обработка
изображения, приведенного на рис. 2 а), этими методами при 4c , результаты кото-
рой представлены на рис. 3. Использование алгоритма mdsFCM (рис. 3 б), в отличие
от метода sFCM (рис. 3 а), позволяет четче выявить область распространения меланомы.
При сравнении с результатами, приведенными на рис. 2 б) и 2 в), изображений на
рис. 3 а) и 3 б) соответственно становится очевидным больший уровень снижения
чувствительности для алгоритма sFCM, чем для метода mdsFCM.
а) б)
Рисунок 3 – Кластеризация изображения, приведенного на рис. 2 а,
при 4c алгоритмами: а) sFCM; б) mdsFCM с применением
стандартной матрицы ковариации
Выводы
Предложенный в данной работе метод гибридной нечеткой кластеризации много-
мерных данных mdsFCM позволяет повысить чувствительность кластеризации цветных
изображений по сравнению с методами sFCM, FCM (при использовании матрицы
неевклидовых расстояний) и Густафсона-Кесселя. Выбор способа формирования мат-
рицы ковариации зависит от исходных данных и оказывает влияние на чувствитель-
ность кластеризации и время ее выполнения. Кроме того, в ряде случаев удается
снизить количество итераций в сравнении с алгоритмом sFCM, что положительно ска-
зывается на быстродействии. Также следует отметить, что при уменьшении количества
кластеров чувствительность алгоритма mdsFCM снижается в меньшей степени, чем
у метода sFCM.
Влияние вида меры расстояния на чувствительность нейро-фаззи кластеризации...
«Штучний інтелект» 4’2012 545
7А
Литература
1. Леоненков А. Нечеткое моделирование в среде MATLAB и fuzzyTECH / Леоненков А. – СПб. :
БХВ-Петербург, 2003. – 719 с.
2. Кохонен Т. Самоорганизующиеся карты / Кохонен Т. ; [пер. 3-го англ. изд. В.Н. Агеева под ред.
Ю.В. Тюменцева]. М. : Бином. Лаборатория знаний, 2008. 665 с.
3. Ахметшина Л.Г. Сегментация низкоконтрастных изображений алгоритмом гибридной кластери-
зации SOM-FCM / Л.Г. Ахметшина, А.А. Егоров // Системні технології. – Дніпропетровськ, 2008. –
Вип. 2 (55). – С. 34-40.
4. Егоров А.А. Повышение быстродействия метода гибридной нечеткой кластеризации за счет дина-
мического сжатия размерности карты Кохонена // А.А. Егоров / Искусственный интеллект. 2011.
№ 4. С. 489-497.
5. Рутковский Л. Методы и технологии искусственного интеллекта / Рутковский Л. М., 2010. 600 с.
6. Ахметшина Л.Г. Повышение чувствительности гибридной нечеткой кластеризации на основе фор-
мирования центроидов пропорционально расстояниям в q-мерном пространстве / Л.Г. Ахметшина,
А.А. Егоров // Геометричне та комп’ютерне моделювання. 2009. Вип. 24. С. 193-198.
7. Ахметшина Л.Г. Повышение чувствительности алгоритма гибридной нечеткой кластеризации на
основе вычисления взвешенного Евклидова расстояния / Л.Г. Ахметшина, А.А. Егоров // Матема-
тичне та програмне забезпечення інтелектуальних систем: IX міжнародна науково-практична конф.,
(Дніпропетровськ, 16 18 листопада 2011 р.). – С. 13-14.
8. Егоров А.А. Визуализация результатов нечеткой кластеризации цветных изображений на основе
метода сравнения с исходными данными / А.А. Егоров // Вестник Херсонского национального тех-
нического университета. 2009. № 2 (35). С. 195-199.
Literatura
1. Leonenkov A. Nechetkoe modelirovanie v srede MATLAB i fuzzyTECH. S.P.: BHV-Peterburg. 2003. 719 s.
2. Kohonen T. Samoorganizujushhiesja karty M.: Binom. Laboratorija znanij. 2008. 665 s.
3. Ahmetshina L.G. Systemnі tehnologіі. Dnіpropetrovs’k. 2008. Vyp. 2 (55). S. 34-40.
4. Egorov A.A. Iskusstvennyj intellekt. 2011. №4. S. 489-497.
5. Rutkovskij L. Metody i tehnologii iskusstvennogo intellekta. M. 2010. 600 s.
6. Ahmetshina L.G. Geometrychne ta komp’juterne modeljuvannja. 2009. Vyp. 24. S. 193-198.
7. Ahmetshina L.G. Matematychne ta programne zabezpechennja іntelektual’nyh system: IX mіzhnarodna
naukovo-praktychna konf. Dnіpropetrovs’k. 1-18 lystopada 2011. S. 13-14.
8. Egorov A.A. Vestnik Hersonskogo nacional’nogo tehnicheskogo universiteta. 2009. № 2(35). S. 195-199.
RESUME
L.G. Akhmetshina, A.A. Yegorov
Influence of the Type of Distance Measure on Sensitivity
of Neuro-Fuzzy Clustering for Multidimensional Data
This article deals with the description and experimental verification of the algorithm
of the hybrid fuzzy clustering of the multidimensional data, i.e. mdsFCM. This algorithm is
the modification of the method sFCM, which correspond the union of the fuzzy clustering
algorithm FCM and SOM (Self Organized Map). The essence of the modification consists
in the using of the non-Euclidian distances based on calculation of the covariance matrix
during fuzzy clustering. This leads to the sensitivity improvement for multidimensional data
processing. Two types of the covariance matrix are shown in this article: standard and fuzzy.
The experimental test of the proposed clustering method showed the sensitivity improvement
and some decreasing of the learning time during multidimensional data processing in comparison
with sFCM, FCM (when non-Euclidian distances based on covariance matrix calculation are
used) and Gustafson-Kessel algorithms. In the capacity of the initial data, it is used the various
low-contrast color medical images, which are the particular case of the multidimensional data.
During experimental tests, less sensitivity reducing of mdsFCM algorithm in comparison
with sFCM was detected when the number of the fuzzy clusters was decreasing.
Статья поступила в редакцию 01.06.2012.
|