Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей
Побудовано афінно-інваріантний глибинний класифікатор на основі глибинних околів, нечутливий до екстремальних значень в задачах розпізнавання. Розроблено процедуру симетризації функцій глибини на основі методу k-найближчих сусідів, що забезпечує центрально-зовнішнє впорядкування для визначення найбл...
Збережено в:
| Опубліковано в: : | Проблемы управления и информатики |
|---|---|
| Дата: | 2016 |
| Автор: | |
| Формат: | Стаття |
| Мова: | Russian |
| Опубліковано: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2016
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/208182 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей / А.А. Галкин // Проблемы управления и информатики. — 2016. — № 3. — С. 171-178. — Бібліогр.: 9 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-208182 |
|---|---|
| record_format |
dspace |
| spelling |
Галкин, А.А. 2025-10-20T14:53:53Z 2016 Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей / А.А. Галкин // Проблемы управления и информатики. — 2016. — № 3. — С. 171-178. — Бібліогр.: 9 назв. — рос. 0572-2691 https://nasplib.isofts.kiev.ua/handle/123456789/208182 519.7 10.1615/JAutomatInfScien.v48.i5.80 Побудовано афінно-інваріантний глибинний класифікатор на основі глибинних околів, нечутливий до екстремальних значень в задачах розпізнавання. Розроблено процедуру симетризації функцій глибини на основі методу k-найближчих сусідів, що забезпечує центрально-зовнішнє впорядкування для визначення найближчих сусідів. Побудова симетризації асимптотично гарантує унікальність найглибшої точки, що вирішує проблему опуклої області з нескінченною множиною найглибших точок. Affine invariant depth based classifier is constructed on the basis of the depth neighborhoods, that is insensitive to extreme values in pattern recognition problems. The symmetrization procedure of depth functions is developed on the basis of k-nearest neighbors, which provides centrally external ordering to determine the nearest neighbors. Construction of symmetrization asymptotically guarantees uniqueness of the deepest point, which solves the problem of a convex domain with an infinite set of the deepest points. ru Інститут кібернетики ім. В.М. Глушкова НАН України Проблемы управления и информатики Роботы и системы искусственного интеллекта Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей Симетризація функцій глибини для побудови афінно-інваріантних класифікаторів на основі глибинно-еліпсоїдних околів Symmetrization of depth functions for the construction of affine-invariant classifiers based on the depth-ellipsoidal neighborhoods Article published earlier |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| title |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| spellingShingle |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей Галкин, А.А. Роботы и системы искусственного интеллекта |
| title_short |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| title_full |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| title_fullStr |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| title_full_unstemmed |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| title_sort |
симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей |
| author |
Галкин, А.А. |
| author_facet |
Галкин, А.А. |
| topic |
Роботы и системы искусственного интеллекта |
| topic_facet |
Роботы и системы искусственного интеллекта |
| publishDate |
2016 |
| language |
Russian |
| container_title |
Проблемы управления и информатики |
| publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
| format |
Article |
| title_alt |
Симетризація функцій глибини для побудови афінно-інваріантних класифікаторів на основі глибинно-еліпсоїдних околів Symmetrization of depth functions for the construction of affine-invariant classifiers based on the depth-ellipsoidal neighborhoods |
| description |
Побудовано афінно-інваріантний глибинний класифікатор на основі глибинних околів, нечутливий до екстремальних значень в задачах розпізнавання. Розроблено процедуру симетризації функцій глибини на основі методу k-найближчих сусідів, що забезпечує центрально-зовнішнє впорядкування для визначення найближчих сусідів. Побудова симетризації асимптотично гарантує унікальність найглибшої точки, що вирішує проблему опуклої області з нескінченною множиною найглибших точок.
Affine invariant depth based classifier is constructed on the basis of the depth neighborhoods, that is insensitive to extreme values in pattern recognition problems. The symmetrization procedure of depth functions is developed on the basis of k-nearest neighbors, which provides centrally external ordering to determine the nearest neighbors. Construction of symmetrization asymptotically guarantees uniqueness of the deepest point, which solves the problem of a convex domain with an infinite set of the deepest points.
|
| issn |
0572-2691 |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/208182 |
| citation_txt |
Симметризация функций глубины для построения аффинно-инвариантных классификаторов на основе глубинно-эллипсоидных окрестностей / А.А. Галкин // Проблемы управления и информатики. — 2016. — № 3. — С. 171-178. — Бібліогр.: 9 назв. — рос. |
| work_keys_str_mv |
AT galkinaa simmetrizaciâfunkciiglubinydlâpostroeniâaffinnoinvariantnyhklassifikatorovnaosnoveglubinnoéllipsoidnyhokrestnostei AT galkinaa simetrizacíâfunkcíiglibinidlâpobudoviafínnoínvaríantnihklasifíkatorívnaosnovíglibinnoelípsoídnihokolív AT galkinaa symmetrizationofdepthfunctionsfortheconstructionofaffineinvariantclassifiersbasedonthedepthellipsoidalneighborhoods |
| first_indexed |
2025-11-26T07:14:12Z |
| last_indexed |
2025-11-26T07:14:12Z |
| _version_ |
1850613867983405056 |
| fulltext |
© А.А. ГАЛКИН, 2016
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 171
РОБОТЫ И СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
УДК 519.7
А.А. Галкин
СИММЕТРИЗАЦИЯ ФУНКЦИЙ ГЛУБИНЫ
ДЛЯ ПОСТРОЕНИЯ АФФИННО-ИНВАРИАНТНЫХ
КЛАССИФИКАТОРОВ НА ОСНОВЕ
ГЛУБИННО-ЭЛЛИПСОИДНЫХ ОКРЕСТНОСТЕЙ
Введение
В задачах распознавания использование статистических функций глубины
позволяет определять центральность произвольной точки rRz относительно ве-
роятностной меры P на ,rR т.е. центральность точки z увеличивается относи-
тельно P пропорционально увеличению глубины данной точки. В настоящей
работе статистическая функция глубины рассматривается как ограниченное
отображение ),( PE с
rR в .R Данное отображение удовлетворяет таким
свойствам: а): для , P что имеет наиболее глубокую точку , для rRz и
],1,0[ ),)1((),( PzEPzE (монотонность относительно наиболее глубо-
кой точки); б): для , P симметричного относительно , где ][][ VPVP
для r -измеримого борелевского множества ,V ),(sup),(
R
PzEPE rz
(макси-
мальное значение в центре); в) для , P 0),( PzE при z (исчезновение на
бесконечности); г) для rr обратной матрицы ,G r -вектора v и P на ,rR
),(),( , PzEPvGzE vG , где vGP ,
определяется через ])([][ 1, vVGPVP vG
для r -измеримого борелевского множества V (аффинно-инвариантность).
Постановка задачи
Областью глубины порядка является множество :{)( rRzPC
}),(: PzE для 0> и статистической функции глубины. Поскольку такие
области глубины вложенные, их индексация будет происходить по вероятностной
схеме, т.е. для 1)[0, величина )(PR
будет указывать на наименьшее значение
)(PR , что имеет P -вероятность . Поэтому для глубинных уровней и вероятност-
ного наполнения используются верхние и нижние индексы для областей глубины.
Отметим, что выборочные формы верхних глубин можно получить путем за-
мены P на соответствующее эмпирическое распределение ,)(mP если в наличии
есть r -измеримые данные mZZ ...,,1 . Можно упорядочить iZ таким образом, что
172 ISSN 0572-2691
),,(...),(),( )(
)(
)(
)2(
)(
)1(
m
m
mm PZEPZEPZE (1)
поскольку выборочная глубина обеспечивает центрально-внешнее упорядочение
элементов данных относительно соответствующей наиболее глубокой точки .)(m
Поэтому в глубинной концепции )1(Z является элементом данных, наиболее близ-
ким к ,)(m )2(Z — вторым элементом данных, наиболее близким к ,)(m …,
а )(mZ — элементом данных, наиболее отдаленным от .)(m
С помощью упорядочения (1) статистическую функцию глубины можно ис-
пользовать для определения соседей наиболее глубокой точки .)(m Однако для
реализации классификатора ближайшего соседа необходимо определить соседей
произвольной точки .rRz
Построение афинно-инвариантных классификаторов
на основе глубинно-эллипсоидных окрестностей
В данной работе предлагается подход, где глубина рассматривается относи-
тельно эмпирического распределения ,
)(m
ZP связанного с выборкой, полученной
добавлением к исходным элементам данных mZZZ ...,,, 21 их отображений
mZzZz 2...,,2 1 относительно .z Отметим, что z — асимптотически уникаль-
ная наиболее глубокая точка относительно .
)(m
ZP Поэтому соответствующее по-
строение симметризации приводит к z -внешнему упорядочению
),(...),(),(
)(
)(,
)(
)2(,
)(
)1(,
m
ZmZ
m
ZZ
m
ZZ PZEPZEPZE , (2)
элементы данных которого не являются упорядоченными, а используются только
для определения порядка.
Итак, глубинные окрестности, т.е. выборочные области глубины )(
)()(
,
m
Z
m
Z PCC
играют важную роль. В данном случае )(m
ZC
означает наименьшую область глу-
бины ,
)(
,
m
ZC которая содержит по меньшей мере часть от точек ....,,, 21 mZZZ
Поэтому для mk / наименьшей глубинной окрестностью является
)(m
ZC
, ко-
торая содержит k всех .iZ
Предлагаем строить глубинные классификаторы k -ближайших соседей путем
замены евклидовых окрестностей на соответственно определенные глубинные
окрестности [1], т.е. в предложенном подходе k -ближайших соседей элемент z
будет отнесен во множество 1, если и только если множество 1 содержит большее
количество элементов данных, чем множество 2 в наиболее малой глубинной
окрестности ,z которая содержит k элементов данных, т.е. в ,
)(m
ZC
где ./ mk
Таким образом, глубинный классификатор запишем
,)(]0[)(]1[)(
1
)()(
1
)(
m
i
m
ii
m
ii
m
i
m
E zDXzDXzn (3)
где ][
1
)( )(
)(
)( m
zim
z
m
i CZ
N
zD
, а ][ )(
1
)( m
zl
m
l
m
z CZN
определяет число эле-
ментов данных в глубинной окрестности .)(m
zC Отметим, что предложенный
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 173
классификатор (3) получен с использованием глубинной оценки )(
)(
z
m
E условно-
го математического ожидания ),(z поскольку
]2/1)([)(
)()(
zzn
m
E
m
E , (4)
где ).(]1[)(
)(
1
)(
zDXz
m
ii
m
i
m
E
Подчеркнем, что в одномерном случае )(m
En сводится к евклидовому класси-
фикатору k -ближайших соседей независимо от статистической функции глуби-
ны .E Кроме того, предложенный классификатор аффинно-инвариантный, т.е.,
если mZZ ...,,1 и z подлежат общей аффинной трансформации, результат классифи-
кации останется неизменным. В данном случае способ определения аффинно-
инвариантного классификатора k -ближайших соседей заключается в применении
классического метода k -ближайших соседей на нормализованных данных
,2/1
iZ ....,,1 mi Для обратной rr -матрицы G и r -вектора v является
аффинно-инвариантной оценкой:
.)...,,()...,,( 11 GZZGvGZvGZ mm (5)
Такой трансформационный подход приводит к окрестностям, которые не ис-
пользуют геометрию распределения в окрестности точки z и являются эллипсои-
дами с z -независимой ориентацией и формой [2, 3].
Предложенный глубинный классификатор на основе метода k -ближайших
соседей согласован при соответствующих условиях. Для этого статистическая
глубинная функция W должна удовлетворять следующим свойствам.
— Свойство уникальной максимизации в центре симметрии, т.е. ),( PE
),( PzE для всех ,z если P симметрично относительно и имеет плот-
ность, положительную в .
— Свойство согласованности, т.е. величина )1(),(),(sup )( oPzEPzE m
Vz
п.н. при m для ограниченного r -измеримого борелевского множества V .
В данном случае )(mP — эмпирическое распределение, связанное с m случай-
ными векторами, являющимися независимыми, одинаково распределенными
случайными величинами .P
— Свойство непрерывности, т.е. ),( PzEz непрерывно в окрестности ,
если распределение P симметрично относительно и имеет плотность, положи-
тельную в .
Теорема 1. Пусть P — вероятностная мера, симметричная в окрестности и
имеет плотность, положительную в . Также предположим, что функция глубины
E удовлетворяет свойствам максимального значения в центре, монотонности от-
носительно наиболее глубокой точки, непрерывности и уникальной максимиза-
ции в центре симметрии. Тогда для , ,0 что ),()( PCV и для
,0 ),(max PzErRz , что }.:R{:)()( zzVPC r
Доказательство. Свойство уникальной максимизации в центре симмет-
рии означает, что для ),[ a отображение d принимает значения
174 ISSN 0572-2691
в .0
R Таким образом, 1
0 )( rW t , что ,0))(()( 0 tdtd т.е. для
),[ a имеем ),()( PCV что доказывает результат для этих значе-
ний . Поэтому, как следует из свойства монотонности относительно наиболее
глубокой точки, вложение )(PC определяет результат для .
Далее зафиксируем такое ,0a что ),( PzEz — непрерывная функция на
),(aV и заметим, что существование следует из свойства максимального значе-
ния в центре, а существование a гарантируется свойством непрерывности [2–5].
Последнее свойство означает, что ),( PzEz достигает минимума в ),(aV
а свой-
ство уникальной максимизации в центре симметрии предполагает, что это мини-
мальное значение .a Используя свойство непрерывности, получаем, что
для ],[ a
,: 1
RWd r })(:{sup PCtdRdt
(6)
является непрерывной функцией, которая точечно сходится к 0)(
td при
. Данная сходимость равномерна, т.е. )1()(sup 1 otdrWt
при ,
поскольку 1rW является компактом.
Теорема доказана.
Теорема 2. Пусть P — вероятностная мера, симметричная в окрестности ,
и имеет плотность, положительную в . Также предположим, что функция глу-
бины E удовлетворяет свойствам максимального значения в центре, монотонно-
сти относительно наиболее глубокой точки, непрерывности, согласованности и
уникальной максимизации в центре симметрии. Пусть
)(mmN
— количество глу-
бинных ближайших соседей в )( )(mPC m
, где mkmm / основывается на после-
довательности ,mk величина )(mP означает эмпирическое распределение
mZZ ...,,1 , где mZZ ...,,1 — независимые одинаково распределенные случайные ве-
личины ,P а
)(, i
Z
— i -й глубинный ближайший сосед . Тогда для ,0
)( mm , что 0)(,
1
)(
i
N
i
Z
mm
п.н. для )( mm .
Доказательство. Как следует из теоремы 1, , что )()(
VPC для
фиксированного .0 Также возьмем такие и ,0 что .
Поскольку PPP
m
)(
при ,m где
)(m
P
и
P — -симметризированные
версии )(m
P и P соответственно, можно утверждать, что — такое целое ,0m что
)()()()(
)(
PCPCPCPC
m
п.н. для . 0mm (7)
Кроме того, как следует из теоремы 1, ,0 что ),()( PCV
поэтому
для 0 mm имеет место такое вложение:
)()()(
)(
VPCV
m п.н. (8)
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 175
Итак, исходя из непрерывности, PZ имеет плотность, положительную
в окрестности . Поэтому 0])([])([/
VPVPmMm при m для
])([
1
VZM i
m
i
m . Кроме того, для ),( 00 mmm
])([
)(
1
m
i
m
i
PCZ
mm kM п.н., поскольку )(mokm при .m
В результате )()()()(
)()()(
VPCPCPC
mmm mm п.н. для таких
значений ,m где ./ mkmm Итак,
)(,...,,1
)(max
iNi
Zmm п.н. для
больших ,m откуда следует результат.
Теорема доказана.
Заметим, что величина 0)(,
1
)(
i
N
i
Z
mm
является всегда определенной
в отличие от .
)(, i
Z
Лемма 1.
2/12)()( )]))()(([(2])([ ZZJXZnP mm для правила
классификации ,]2/1)([)( )()( zzn mm полученного из регрессионной оценки
)()( zm для ,]|]1[[)( zZXz где ])([ XZnPJ B является вероятно-
стью ошибочной классификации правила Байеса.
Доказательство. Можно утверждать, что
,]|)()([2]|)([ )()(
m
m
m
m ZZJXZnP (9)
где m — сигма-алгебра, связанная с выборкой ),( ii XZ , mi ...,,1 [6]. Итак, ре-
зультат можно получить, принимая математические ожидания с обеих сторон не-
равенства (9) и применяя неравенство Йенсена.
Лемма доказана.
Далее рассмотрим теорему 3, представляющую основной результат данной
работы, который показывает, что предложенные классификаторы непараметричес-
ки согласованы при любых непрерывных распределениях. Это отличаяет ее от
других глубинных классификаторов, согласованных только при полупараметри-
ческих и эллиптически-распределительных предположениях.
Теорема 3. Пусть mk — последовательность таких положительных чисел,
что mk и )(mokm при .m Кроме того, пусть E — функция глубины,
которая удовлетворяет свойствам максимальности в центре, монотонности отно-
сительно наиболее глубокой точки, а также свойствам непрерывности, уникаль-
ной максимизации в центре симметрии и согласованности. Предположим, что
][| lXZ имеет функцию плотности ,lh набор точек разрыва которой составляет
меру Лебега нуль для .1,0l Тогда, если m является сигма-алгеброй, связан-
ной с ),( ii XZ , mi ...,,1 , то при m имеет место согласованность глубинно-
го классификатора mk -ближайших соседей
)(m
En в (3), т.е.
,)1(])([]|)([
)(
PBm
m
E oXZnPXZnP (10)
Доказательство. Предположим, что ,}0)(:R{)(Supp zhzh r а также
определим )( lhS для множества точек непрерывности ,lh 1,0l , где
.)()()(upp 10 hShShSM (11)
176 ISSN 0572-2691
Отметим, что Z имеет функцию плотности ,)()()( 1100 zhpzhpzhz что
следует из теоремы Байеса [7].
Следовательно, при 1][ MZP
,0)(
)()(Supp )(Supp\
}1,0{
dzzh
hS
RZ
P
h
RZ
P
M
RZ
P
hR
l
r
l
rr
r (12)
поскольку )(\ l
r hSR имеет нулевую меру Лебега, где .1,0l
Далее предположим, что ,Mz где ))()(/()()( 110011 zhpzhpzhpzz —
непрерывная функция на .M Оценку )(m
E с (3) можно записать в такой форме:
,
1
)( )(,
1
)(
)(
1
)(
)(
iz
N
i
m
z
m
ii
m
i
m
E X
N
zDX
m
z
(13)
предполагая, что ,)()(, zliz XX где )(zl такое, что .)()(, zliz ZZ
Итак,
,)(2)(2]))()([:)(
)(
2
)(
1
2)()( zQzQzzzQ
mmm
E
m (14)
где
,))((
1
)( 2
)(,)(,
1
)(
)(
1
)(
iziz
N
i
m
z
m
ZX
N
zQ
m
z
(15)
.))((
1
)( 2
)(,
1
)(
)(
2
)(
zX
N
zQ iz
N
i
m
z
m
m
z
(16)
Заметим, что величина m заменена на для упрощения записи. Кроме
того, )( )(,)(, iziz ZX , ,...,,1 mi являются нулевыми средними значениями
взаимно независимых случайных величин, на что указывает
)(m
Z для сигма-
алгебры, порожденной ,iZ mi ...,,1 [8].
В результате, используя тот факт, что m
m
z kN )( п.н., при m получаем
равенство
]|))())((([
)(
1
)(
)(
)(,)(,)(,)(,
1,
2)(
)(
1
)(
m
Zlzlziziz
N
li
m
z
m
ZXZX
N
zQ
m
z
.)1(
44
]|))(([
)(
1
)(
)(2
)(,)(,
1
2)(
)(
o
kN
ZX
N m
m
z
m
Ziziz
N
i
m
z
m
z
(17)
Далее, используя неравенство Коши-Шварца, для 0 имеем неравенство
2
)(,
1
)(
2
)(,
1
)(
)(
2 ))()((
1
))()((
1
)(
)()(
zZ
N
zZ
N
zQ iz
N
i
m
z
iz
N
i
m
z
m
m
z
m
z
][))()((
1
][ )(,
2
)(,
1
)()(,
)(
zZzZ
N
zZ iziz
N
i
m
z
iz
m
z
.);();(:][
1
4)()(sup
)(
22)(,
1
)(
2
)(
)(
zQzQzZ
N
zz
m
iz
N
i
m
zVz
m
z
z
(18)
Международный научно-технический журнал
«Проблемы управления и информатики», 2016, № 3 177
Поэтому для 0 можно выбрать такое 0)( , что .))(;(2 zQ
Данный вывод следует из непрерывности в .z Кроме того, очевидно, что
0))(;(
)(
2 zQ
m
для больших ,m а поскольку )(
)(
2 zQ
m является ,)1(o то это
свойственно и для )()( zQ m .
Следовательно, при m
]]|)([[]]|)([[
)()(
JXZnPJXZnP m
m
Em
m
E
),1(])))()([(2])([ 2/12)()(
oZZJXZnP
m
E
m
E (19)
поскольку JXZnP m
m
E ]|)([
)(
п.н.
Теорема доказана.
Заключение
Предложенный метод глубинных окрестностей может эффективно приме-
няться не только для задач классификации, но и для задач оценки общей плот-
ности h независимых одинаково распределенных случайных r -векторов ,iZ
где ....,,1 mi Кроме того, использование глубинных окрестностей представ-
ляет интерес в регрессионных задачах, где условное среднее значение функ-
ции ]|[)( zZXznz оценивается на основе взаимно независимых групп
),( ii XZ случайного вектора ),( XZ со значениями в ,RRr где ....,,1 mi
Запишем оценки mk ближайших соседей для регрессионных задач и задач оценки
общей плотности:
i
m
zi
m
im
i
m
i
m
i
m XVZ
k
XzNzn mm ][
1
)()(
)(
1
)(
1
)(
и ,)()(
)()( m
zrm
m mVmkzh
(20)
где r — мера Лебега на ,rR ,/ mkmm а )(m
zV — наименьший шар Евклида с
центром в ,z который содержит часть от .iZ В результате имеют место глу-
бинные оценки mk ближайших соседей )(
)(
zn
m
E и ),(
)(
zh
m
E полученные заменой
в (20) евклидовых окрестностей m
zV
их глубинными окрестностями )(m
z
mC
и ][
)(
1
m
zi
m
i
m
mVZk
с ][
)(
1
)( m
zi
m
i
m
z
mm CZV
.
Исследование свойств глубинных методов выходит за рамки данной работы,
однако достаточно вероятно, что свойства согласованности, полученные в за-
даче классификации, также распространяются на задачи регрессии и оценки
плотности. Основываясь на [9], можно утверждать, что в задачах оценки плот-
ности использование несферических, а именно эллипсоидных окрестностей,
может привести к фундаментальным конечно-выборочным свойствам. В дан-
ном случае глубинные оценки mk ближайших соседей достаточно эффектив-
ны, поскольку используют несферические и неэллипсоидальные окрестности,
форма которых определяется локальной геометрией выборки. Кроме того, в
отличие от r -измеримых эллипсоидальных окрестностей, где необходимо выби-
рать 2/)1( rr параметров полосы пропускания, глубинные окрестности требуют
только выбора скалярного параметра полосы пропускания.
178 ISSN 0572-2691
О.А. Галкін
СИМЕТРИЗАЦІЯ ФУНКЦІЙ
ГЛИБИНИ ДЛЯ ПОБУДОВИ
АФІННО-ІНВАРІАНТНИХ КЛАСИФІКАТОРІВ
НА ОСНОВІ ГЛИБИННО-ЕЛІПСОЇДНИХ ОКОЛІВ
Побудовано афінно-інваріантний глибинний класифікатор на основі глибинних
околів, нечутливий до екстремальних значень в задачах розпізнавання. Розроб-
лено процедуру симетризації функцій глибини на основі методу k-най-
ближчих сусідів, що забезпечує центрально-зовнішнє впорядкування для ви-
значення найближчих сусідів. Побудова симетризації асимптотично гарантує
унікальність найглибшої точки, що вирішує проблему опуклої області з не-
скінченною множиною найглибших точок.
А.A. Galkin
SYMMETRIZATION OF DEPTH
FUNCTIONS FOR THE CONSTRUCTION
OF AFFINE-INVARIANT CLASSIFIERS BASED
ON THE DEPTH-ELLIPSOIDAL NEIGHBORHOODS
Affine invariant depth based classifier is constructed on the basis of the depth neigh-
borhoods, that is insensitive to extreme values in pattern recognition problems. The
symmetrization procedure of depth functions is developed on the basis of k-nearest
neighbors, which provides centrally external ordering to determine the nearest neigh-
bors. Construction of symmetrization asymptotically guarantees uniqueness of the
deepest point, which solves the problem of a convex domain with an infinite set of
the deepest points.
1. Rousseeum P.J., Struyf A. Characterizing angular symmetry and regression symmetry // Statist.
Plann. Inference. — 2004. — 122. — P. 163–170.
2. Mosler K. Multivariate dispersions, central regions and depth. — Springer Science & Business
Media, 2002. — 291p.
3. Oja H., Paindaveine D. Optimal signed-rank tests based on hyperplanes // J. Statist. Plann. Infe-
rence. — 2005. — 135. — P. 307–321.
4. Zuo Y., Serfling R. Structural properties and convergence results for contours of sample statistical
depth functions // The Annals of Statistics. — 2000. — 28. — P. 484–497.
5. Godtliebsen F., Marron J.S. , Chaudhuri P. Significance in scale space for bivariate density esti-
mation // Journal of Computational and Graphical Statistics. — 2002. — 11. — P. 1–22.
6. Holmes C.C., Adams N.M. A probabilistic nearest neighbor method for statistical pattern recognition //
Journal of the Royal Statistical Society. — 2002. — 64. — P. 295–306.
7. Chacon J.I., Duong T., Wand M.P. Asymptotics for general multivariate kernel density derivative
estimators // Statist. — 2011. — 21. — P. 810–837.
8. Jornsten R., Vardi Y. , Zhang C.H. A robust clustering method and visualization tool based on da-
ta depth // Statistical data Analysis. — 2002. — P. 354–365.
9. Lange T., Mosler K., Mozharovskyi P. Fast nonparametric classification based on data depth //
Statist. Papers. — 2014. — 55. — P. 53–67.
Получено 14.09.2015
Статья представлена к публикации чл.-корр. НАН Украины А.В. Анисимовым.
|