Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам
В работе предложен новый подход к решению задачи совместного построения решающих правил классификации и рабочего словаря признаков в обучающихся системах распознавания, основанный на использовании взвешенных обучающих выборок. Описаны метод w-GridDC формирования взвешенной обучающей выборки w-объект...
Saved in:
| Published in: | Штучний інтелект |
|---|---|
| Date: | 2012 |
| Main Author: | |
| Format: | Article |
| Language: | Russian |
| Published: |
Інститут проблем штучного інтелекту МОН України та НАН України
2012
|
| Subjects: | |
| Online Access: | https://nasplib.isofts.kiev.ua/handle/123456789/57731 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Cite this: | Метод совместного построения решающих правил и выбора словаря признаков 
 по взвешенным обучающим выборкам / Е.В. Волченко // Штучний інтелект. — 2012. — № 4. — С. 316-323. — Бібліогр.: 11 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1860244016968237056 |
|---|---|
| author | Волченко, Е.В. |
| author_facet | Волченко, Е.В. |
| citation_txt | Метод совместного построения решающих правил и выбора словаря признаков 
 по взвешенным обучающим выборкам / Е.В. Волченко // Штучний інтелект. — 2012. — № 4. — С. 316-323. — Бібліогр.: 11 назв. — рос. |
| collection | DSpace DC |
| container_title | Штучний інтелект |
| description | В работе предложен новый подход к решению задачи совместного построения решающих правил классификации и рабочего словаря признаков в обучающихся системах распознавания, основанный на использовании взвешенных обучающих выборок. Описаны метод w-GridDC формирования взвешенной обучающей выборки w-объектов, алгоритм w-MIEF построения рабочего словаря признаков на её основе и модифицированный метод k-ближайших соседей для выполнения классификации объектов. Приведены результаты экспериментальных исследований, подтвердившие эффективность предложенного подхода.
У роботі запропонований новий підхід до вирішення задачі побудови розвя’зувальних правил класифікації та робочого словника ознак у системах розпізнавання, що навчаються. Основою цього підходу є використання зважених навчальних вибірок. Наведено метод w-GridDC формування зваженої навчальної вибірки w-об’єктів, алгоритм w-MIEF побудови робочого словника ознак на її основі та модифікований метод k-найближчих сусідів для виконання класифікації об’єктів. Наведено результати експериментальних досліджень, що підтверджують ефективність запропонованого підходу.
A new approach to solving the problem of joint constructing of classification decision rules and feature selection in the recognition training systems based on weighted training samples use is given in the article. W-GridDC method of forming a weighted training sample of w-objects, the algorithm w-MIEF of construction the feature set based on it, and a modified method of k-nearest neighbor for objects classification are described. Experimental results have confirmed the effectiveness of the proposed approach.
|
| first_indexed | 2025-12-07T18:34:00Z |
| format | Article |
| fulltext |
«Искусственный интеллект» 4’2012 316
4В
УДК 004.93’11
Е.В. Волченко
Институт информатики и искусственного интеллекта
ГВУЗ «Донецкий национальный технический университет», г. Донецк, Украина
Украина, 83050, г. Донецк, просп. Б. Хмельницкого, 84, LM@mail.promtele.com
Метод совместного построения
решающих правил и выбора словаря признаков
по взвешенным обучающим выборкам
E.V. Volchenko
Institute of Informatics and Artificial Intelligence
Donetsk National Technical University, Donetsk, Ukraine
Ukraine, 83050, Donetsk, 84 B. Khmelnitsky avenue
Method of Joint Construction of Decision Rules and Feature
Selection Based on Weighted Training Samples
О.В. Волченко
Інститут інформатики і штучного інтелекту
ДВНЗ «Донецький національний технічний університет», м. Донецьк, Україна
Україна, 83050, м. Донецьк, просп. Б. Хмельницького, 84
Метод сумісної побудови розв’язувальних правил
та словника ознак по зважених навчаючих вибірках
В работе предложен новый подход к решению задачи совместного построения решающих правил
классификации и рабочего словаря признаков в обучающихся системах распознавания, основанный
на использовании взвешенных обучающих выборок. Описаны метод w-GridDC формирования взвешенной
обучающей выборки w-объектов, алгоритм w-MIEF построения рабочего словаря признаков на её
основе и модифицированный метод k-ближайших соседей для выполнения классификации объектов.
Приведены результаты экспериментальных исследований, подтвердившие эффективность предложенного
подхода.
Ключевые слова: адаптивная система распознавания, обучающая выборка, w-объект, словарь
признаков.
A new approach to solving the problem of joint constructing of classification decision rules and feature selection in
the recognition training systems based on weighted training samples use is given in the article. W-GridDC
method of forming a weighted training sample of w-objects, the algorithm w-MIEF of construction the feature
set based on it, and a modified method of k-nearest neighbor for objects classification are described. Experimental
results have confirmed the effectiveness of the proposed approach.
Key words: adaptive recognition system, training samples, w-object, feature selection.
У роботі запропонований новий підхід до вирішення задачі побудови розвя’зувальних правил класифікації
та робочого словника ознак у системах розпізнавання, що навчаються. Основою цього підходу є
використання зважених навчальних вибірок. Наведено метод w-GridDC формування зваженої навчальної
вибірки w-об’єктів, алгоритм w-MIEF побудови робочого словника ознак на її основі та модифікований
метод k-найближчих сусідів для виконання класифікації об’єктів. Наведено результати експериментальних
досліджень, що підтверджують ефективність запропонованого підходу.
Ключові слова: адаптивна система розпізнавання, навчальна вибірка, w-об’єкт, словник ознак.
Метод совместного построения решающих правил и выбора словаря признаков...
«Штучний інтелект» 4’2012 317
4В
Введение
Основными задачами, решаемыми при построении обучающихся систем распо-
знавания, являются задачи построения эффективных решающих правил классификации
и формирования рабочего словаря признаков [1]. На сегодняшний день одной из основ-
ных проблем при решении этих задач является большой объем исходных данных,
которые должна обрабатывать система за выделенное время. Так, в задачах автома-
тической классификации текстов в новостных лентах и электронных библиотеках
словарь признаков может состоять из тысяч ключевых слов, а обучающая выборка
содержать десятки и сотни тысяч текстов [2].
Необходимость построения рабочего словаря признаков, состоящего в выборе
оптимального набора наиболее информативных признаков из множества всех приз-
наков априорного словаря, обусловлена значительными временными и емкостными
затратами на измерение всех признаков классифицируемого объекта и выполнение
классификации [1], [3], [4]. Задача построения решающего правила классификации
состоит в формировании по всем объектам обучающей выборки выражения или алго-
ритма классификации распознаваемых объектов, обеспечивающего минимальную
ошибку классификации [1], [3]. В теории построения систем распознавания эти задачи
в большинстве случаев рассматриваются независимо друг от друга, хотя выбор алго-
ритма построения решающих правил в значительной мере зависит от набора признаков,
которыми описываются распознаваемые объекты, а построенный словарь признаков
оценивается качеством классификации по построенному решающему правилу.
При комплексном подходе к построению решающих правил классификации и
формированию рабочего словаря признаков данную задачу, согласно [5], называют
задачей комбинированного типа DX (построения решающего правила D в наиболее
информативном подпространстве признаков Х). Её сложность состоит в необходи-
мости одновременного решения двух ключевых задач распознавания: построения
эффективного решающего правила классификации, для которой в большинстве случаев
увеличение количества признаков приводит к повышению эффективности классифи-
кации и минимизации словаря признаков для сокращения временных и емкостных
затрат на выполнение классификации [6].
Наиболее известными алгоритмами решения задачи типа DX являются:
– алгоритмы CORAL и DW [1], основанные на переборе всех возможных сло-
варей признаков и формировании на их основе решающих правил классификации;
– алгоритм FRiS-DX [6], основанный на выборе очередного варианта признако-
вого подпространства и построения в нем решающего правила на основе алгоритма
FRiS-Stolp, выделяющего подмножества эталонных объектов, на основании которых
выполняется классификация.
Данные алгоритмы на основании анализа полной исходной информации выделяют
некоторое признаковое подпространство, а затем выполняют анализ всех объектов
для построения решающих правил. Учитывая большой объем обрабатываемых исход-
ных данных, можно предположить, что такой подход потребует больших временных
и вычислительных затрат из-за необходимости при выборе каждого нового призна-
кового подпространства обрабатывать все исходное множество данных.
В данной работе на основе разработанных ранее алгоритмов [7], [8] предлагается
новый подход к решению задачи типа DX, который состоит в предварительном сок-
ращении исходной выборки путем перехода к сокращенным взвешенным выборкам
w-объектов и дальнейшем построении оптимального словаря признаков и решающего
правила классификации на их основе.
Волченко Е.В.
«Искусственный интеллект» 4’2012 318
4В
Целью данной работы является разработка метода совместного построения
решающих правил классификации и рабочего словаря признаков на основе взвешенных
выборок w-объектов в обучающихся системах распознавания.
Постановка задачи
В качестве исходных данных дано некоторое множество объектов },,,{ 21 kXXXX ,
представленное в виде объединения непересекающихся классов
l
i
lVX
1
и называемое
обучающей выборкой. Каждый объект iX из X описывается системой признаков,
т.е. },,,{ 21 iniii xxxX , и представляется точкой в линейном пространстве признаков,
т.е. n
i RX . Для каждого объекта iX известна его классификация ],1[ lyi .
Решение задачи классификации некоторого объекта },,,{ 21 snsss xxxX пред-
полагает выполнение двух этапов обработки исходной выборки X для получения
сокращенной по количеству объектов и их признаков взвешенной обучающей выборки
и выполнение непосредственной классификации.
На первом этапе необходимо сформировать классифицированную взвешенную
обучающую выборку w-объектов },,2,1{ W
mXWXWXWX , VyW
i , где
},...,,,{ 21 iinii
W
i pxxxX , ip – вес i-го w-объекта.
На втором этапе необходимо по выборке w-объектов построить сокращенный
рабочий словарь из k ( nk ) признаков при условии неухудшения эффективности
классификации.
Построение выборки w-объектов по исходной обучающей
выборке на основе алгоритма w-GridDC
Общим принципом построения сокращенных обучающих выборок w-объектов
[8], [9] является выделение областей компактного расположения объектов одного
класса в пространстве признаков и замена этого множества объектов одним w-объек-
том, вес которого характеризует количественные или топологические особенности
найденного множества. Приведем далее обобщенное описание метода w-GridDC пос-
троения выборки w-объектов.
Идеей метода w-GridDC [8] является наложение сетки на признаковое простран-
ство для формирования множества клеток, определение объектов выборки, принад-
лежащих каждой из клеток и их замена на w-объекты. Формирование объектов новой
выборки выполняется только в случае принадлежности всех объектов клетки одному
классу. Вес w-объектов определяется по количеству объектов исходной выборки,
принадлежащих клетке.
Далее приведем пошаговое описание метода. Без потери общности получаемых
решений применим стандартный для теории распознавания подход, заключающийся
в рассмотрении двухклассовых систем.
Шаг 1. Формирование сетки. Рассчитывается шаг клетки s по формуле:
,
1
})min{}(max{*
)1)ln((*
1
})min{}(max{
1
n
i ixixn
k
nn
i ixix
s
Метод совместного построения решающих правил и выбора словаря признаков...
«Штучний інтелект» 4’2012 319
4В
где ... – оператор округления до ближайшего целого значения;
}max{ ix – максимальное значение i-го признака среди всех объектов выборки,
}min{ ix – минимальное значение.
Выполняется разбиение признакового пространства nR по каждому из n приз-
наков на интервалы длиной s (наложение прямоугольной сетки), результатом которого
является множество клеток G . Далее для каждого объекта выборки X определяется
клетка, которой этот объект принадлежит.
Показано [8], что объект iX принадлежит некоторой клетке jG тогда и только
тогда, когда каждое из значений его признаков входит в интервал значений соответ-
ствующих признаков данной клетки.
В результате формирования сетки и обработки объектов исходной обучающей
выборки будут сформированы непересекающиеся подмножества
jGX объектов, при-
надлежащих соответствующим клеткам jG , Gj ,1 .
Шаг 2. Формирование значений признаков w-объектов.
Возможны следующие варианты обработки содержимого клеток.
1. Если все объекты клетки принадлежат к одному классу, то значения признаков
объекта новой выборки рассчитываются как координаты центра масс объектов этой
клетки:
jGi
j
XX
it
G
jt x
X
x 1
, nt ,1 .
2. Если клетка не содержит ни одного объекта, то объект новой выборки не
формируется.
3. Если клетка содержит объекты нескольких классов, то она делится на две
равные по размеру клетки (поочередно вертикально или горизонтально) до тех пор,
пока любая из клеток внутри начальной клетки не будет содержать объекты только
одного класса. Далее по каждой из полученных клеток формируются объекты новой
выборки (согласно случаям 1 и 2).
Классификация w-объекта определяется по классификации объектов, по которым
он сформирован.
Шаг 3. Определение веса w-объектов. Вес w-объекта равен количеству объектов
исходной выборки, принадлежащих клетке, т.е.
jGj Xp .
В результате выполнения алгоритма будет получена новая взвешенная обучающая
выборка w-объектов WX .
Построение рабочего словаря признаков на основе
взвешенных обучающих выборок w-объектов
Введение в описание объектов взвешенной обучающей выборки новой характе-
ристики – веса – не позволяет эффективно использовать известные алгоритмы пос-
троения рабочего словаря признаков. Для решения задачи построения рабочего словаря
признаков по взвешенным обучающим выборкам w-объектов в [7] предложен метод
w-MIEF, описание которого приведем далее.
Волченко Е.В.
«Искусственный интеллект» 4’2012 320
4В
Основой метода w-MIEF является оценка индивидуальной информативности
признаков по обобщенному критерию, включающему в себя отношение дискриминанта
Фишера и коэффициент индивидуальной эффективности распознавания. Основной
особенностью предлагаемого метода является использование в качестве исходных
данных взвешенной выборки w-объектов.
Алгоритм w-MIEF состоит из следующих этапов.
1. Инициализация алгоритма (значений дискриминанта Фишера nifisheri ,1,0
и среднего значения 0fisherAvg ).
2. Вычисление отношения дискриминанта Фишера для всех признаков априор-
ного словаря
,
)(
1 1
2
1
l
j
l
a
aijiaj
l
j
jij
i
ja
mmPP
DP
fisher
где jiD – дисперсия значений i -го признака по j -му классу,
jim – среднее значение i -го признака по j -му классу.
3. Вычисление степени покрытия классов признаками априорного словаря
jji
S
a
ja
ji Pm
msfeatValIte
erage
i
1cov ,
где iS – количество уникальных найденных значений признака ix ,
jamsfeatValIte – количество объектов класса j с заданным значением i -го
признака.
4. Вычисление взвешенной эффективности признаков
k
a
a
j
l
j
i
p
ghtfeatValWei
fweightedEf
1
1 ,
где jghtfeatValWei – суммарный вес объектов класса j с заданным значением
i -го признака,
ap – вес w-объекта.
5. Выбор наилучших признаков:
1) с максимальной эффективностью по степени перекрытия классов:
l
j
ji
ni
eragegeBestCovera
1,1
covmax ,
2) с максимальной эффективностью по информативности:
ini
fweightedEfBestFi
,1
max
.
6. Формирование рабочего словаря признаков по параметрам максимальной
эффективности по степени перекрытия классов и информативности признаков по
следующим правилам:
1) эффективность текущего признака совпадает с эффективностью лучшего
признака;
Метод совместного построения решающих правил и выбора словаря признаков...
«Штучний інтелект» 4’2012 321
4В
2) эффективность признака больше 0 и данный признак улучшает распознавание
хотя бы одного класса;
3) эффективность признака больше 0 и распознавание хотя бы одного из
классов лежит в пределах порога t , заданного пользователем.
Отметим, что наличие пользовательского порога связно с тем, что возможны
ситуации, когда признаки не улучшают распознавание хотя бы одного из классов,
но, тем не менее, имеют эффективность, близкую к лучшей эффективности распоз-
навания классов. Таким образом, если для рассматриваемого признака разница между
лучшей и текущей эффективностью распознавания любого из классов находится в
пределах , то данный признак также считается информативным и включается в
рабочий словарь признаков.
В результате работы алгоритма w-MIEF будет сформирован рабочий словарь,
содержащий k ( nk ) признаков.
Выполнение классификации на основе
взвешенной выборки w-объектов
Для классификации объектов на основе взвешенных обучающих выборок w-объ-
ектов будем использовать модифицированный алгоритм k-ближайших соседей [9],
широко применяющийся при решении задач классификации в условиях неполных
априорных данных. Выбор данного метода для классификации на основе взвешенной
обучающей выборки основывается на результатах исследований [10], согласно которым
он будет показывать высокую эффективность классификации при использовании
сокращенной обучающей выборки.
Модификация алгоритма k-ближайших соседей в данном случае будет состоять
в использовании метрики, позволяющей определять близость между объектами взве-
шенной обучающей выборки и классифицируемым объектом sX [10]:
i
n
o
soio
s
W
iW p
xx
XXd
1
2)(
),( .
Для определения классификации sX найдем k-ближайших к нему w-объектов
каждого из классов и отнесем к тому классу, суммарное расстояние до w-объектов
которого минимально.
Результаты экспериментальных исследований
Для оценки эффективности предложенного подхода был проведен ряд экспери-
ментальных исследований. В качестве исходных данных были использованы выборки
объектов двух классов размером 1000 – 5000 объектов при 20% пересечении областей
классов в пространстве признаков, содержащих 10-100 признаков распознавания.
Для генерации значений признаков использовался нормальный и равномерный законы
распределения. Также для экспериментальных исследований были использованы
наборы данных репозитория UCI [11].
В качестве критерия оценки эффективности классификации использовалась
частота неверных классификаций. Количество «ближайших соседей» было выбрано
равным 10% размера обучающей выборки w-объектов.
При анализе результатов предложенного подхода к решению рассматриваемой
задачи были получены следующие результаты:
Волченко Е.В.
«Искусственный интеллект» 4’2012 322
4В
1) размер взвешенных выборок w-объектов составил в среднем 2,3% размера
исходных обучающих выборок;
2) количество признаков, включенных в рабочий словарь, составило 40% - 55%
исходного количества признаков;
3) частота неверной классификации объектов тестовой выборки модифициро-
ванным методом k-ближайших соседей по выборке w-объектов с использованием
рабочего словаря признаков уменьшилась в среднем на 3,7% по сравнению с частотой
неверной классификации методом k-ближайших соседей по исходной выборке.
4) эффективность предложенного подхода увеличивалась с увеличением размера
исходных обучающих выборок.
Таким образом, результаты тестовых испытаний подтвердили эффективность
предложенного подхода к совместному построению решающих правил классификации
и рабочего словаря признаков на основе взвешенных выборок w-объектов.
Выводы
В данной работе предложен новый подход к решению задачи типа DX построения
эффективного решающего правила классификации с определением минимального
словаря признаков, основанный на переходе к взвешенным обучающим выборкам w-
объектов. Описаны метод w-GridDC формирования взвешенной обучающей выборки
w-объектов, алгоритм w-MIEF построения рабочего словаря признаков на её основе
и модифицированный метод k-ближайших соседей для выполнения классификации
объектов. Анализ предложенного подхода показал сходимость составляющих его
методов, их низкую временную сложность, корректность обработки объектов исходной
выборки. Отличительной особенностью данного подхода является использование
сокращенной взвешенной обучающей выборки, что позволяет существенно сократить
временные и емкостные затраты на построение словаря признаков и выполнение
классификации объектов при сохранении начального уровня эффективности работы
системы.
Литература
1. Загоруйко Н.Г. Прикладные методы анализа знаний и данных / Загоруйко Н.Г. – Новосибирск :
Издательство института математики, 1999. – 270 c.
2. Pal K.S. Pattern recognition: from classical to modern approaches / K.S. Pal, A. Pal – Calcutta : World
scientific, 2001. – 612 p.
3. Theodoridis S. Pattern Recognition / S.Theodoridis, K. Koutroumbas. – San Diego : Academic Press,
2008. – 823 p.
4. Загоруйко Н.Г. Проблема выбора в задачах анализа данных и управления / Н.Г. Загоруйко, Г.С. Лбов //
Сиб. журн. индустр. матем. – № 3:1. – 2000. – С. 101-109.
5. Загоруйко Н.Г. Методы распознавания и их применение. / Загоруйко Н.Г. – М. : Сов. радио, 1972. –
206 с.
6. Борисова И.А. Использование FRiS-функции для построения решающего правила и выбора приз-
наков (задача комбинированного типа DX) / И.А. Борисова, В.В. Дюбанов, Н.Г. Загоруйко, О.А. Кут-
ненко // Труды Всероссийской Конференции «Знания-Онтологии-Теории» (ЗОНТ-07), Новосибирск,
2007. – Том I. – С. 37-44.
7. Волченко Е.В. Метод w-MIEF построения рабочего словаря признаков на основе взвешенных обу-
чающих выборок / Е.В. Волченко, В.С. Степанов // Вісник Національного технічного університету
«Харківський політехнічний інститут». Збірник наукових праць. Тематичний випуск: Нові рішення в
сучасних технологіях. – Харків : НТУ «ХПІ», 2012. – № 18. – С. 26-33.
8. Волченко Е.В. Сеточный подход к построению взвешенных обучающих выборок w-объектов в
адаптивных системах распознавания / Е.В. Волченко // Вісник Національного технічного універси-
тету «Харківський політехнічний інститут». Збірник наукових праць. Тематичний випуск: Інфор-
матика i моделювання. – Харків : НТУ «ХПІ», 2011. – № 36. – С. 12-22.
Метод совместного построения решающих правил и выбора словаря признаков...
«Штучний інтелект» 4’2012 323
4В
9. Волченко Е.В. Метод построения взвешенных обучающих выборок в открытых системах распо-
знавания / Е.В. Волченко // Доклады 14-й Всероссийской конференции «Математические методы
распознавания образов (ММРО-14)», Суздаль, 2009. – М. : Макс-Пресс, 2009. – С. 100-104.
10. Волченко Е.В. О способе определения близости объектов взвешенных обучающих выборок /
Е.В. Волченко // Вісник Національного технічного університету «Харківський політехнічний інститут».
Збірник наукових праць. Тематичний випуск: Інформатика i моделювання. – Харків : НТУ «ХП»,
2012. – № 15. – С. 12-20.
11. Merz C.J. UCI Repository of machine learning datasets / C.J. Merz, P.M. Murphy // Information and
Computer Science University of California, Irvine, CA, 1998. – Режим доступа: http://www.ics.uci.edu/
~mlearn/databases
Literatura
1. Zagorujko N.G. Prikladnye metody analiza znanij i dannyh. Novosibirsk: Izdatelstvo instituta matematiki,
1999. 270 s.
2. Pal K. S. Pattern recognition: from classical to modern approaches. Calcutta: World scientific. 2001. 612 p.
3. Theodoridis S. Pattern Recognition. San Diego: Academic Press. 2008. 823 p.
4. Zagorujko N.G. Problema vybora v zadachah analiza dannyh i upravleniya. Sib. zhurn. industr. matem.
№31. 2000. S. 101-109.
5. Zagorujko N.G. Metody raspoznavaniya i ih primenenie. M.: Sov. Radio. 1972. 206 s.
6. Borisova I.A. Trudy vserossijskoj konferencii “Znaniya-Ontologii-Teorii” (ZONT-07). Novosibirsk 2007.
T. I. S. 37-44.
7. Volchenko E.V. Vіsnyk nacіonalnogo tehnіchnogo unіversytetu “Harkіvskyj polіtehnіchnyj іnstytut”.
Zbіrnyk naukovih prac’. Tematychnij vypusk: Novі rіshennya v suchasnih tehnologіyah. Harkіv: NTU “HPI”.
2012. № 18. S. 26-33.
8. Volchenko E.V. Vіsnyk nacіonalnogo tehnіchnogo unіversytetu “Harkіvskyj polіtehnіchnyj іnstytut”.
Zbіrnyk naukovih prac’. Tematychnij vypusk: Informatyka i modelyuvannya. Harkіv: NTU “HPI”. 2011.
№ 36. S. 12-22.
9. Volchenko E.V. Doklady 14 Vserossijskoj konferencii “Matematicheskie metody raspoznavaniya obrazov
MMRO-14”. Suzdal. 2009. M.: Maks-Press. 2009. S. 100-104.
10. Volchenko E.V. Vіsnyk nacіonalnogo tehnіchnogo unіversytetu “Harkіvskyj polіtehnіchnyj іnstytut”.
Zbіrnyk naukovih prac’. Tematychnij vypusk: Informatyka i modelyuvannya. Harkіv: NTU “HPI”. 2012.
№ 15. S. 12-20.
11. Merz C.J. Information and Computer Science University of California. Irvine. CA. 1998. http://www.ics.
uci.edu/~mlearn/databases
RESUME
E.V. Volchenko
Method of Joint Construction of Decision Rules and Feature
Selection Based on Weighted Training Samples
The problem of joint constructing of decision rules of classification and feature selection
in training recognition systems is considered in the work. The main problem is the need to
analysis of large volume of input data. Existing methods for its solution are considered,
features of their implementation are defined.
The weighted training samples using to reduce the amount of computation is proposed,
where each object is formed by the set of objects in the original sample. The grid method
w-GridDC of forming a weighted training set of objects was described. Algorithm w-MIEF
of construction of feature set using a weighted sample, based on an assessment of information
content of features of weight w-objects is given. The modified method of k-nearest neighbors
for objects classification using a weighted sample is proposed.
The effectiveness of the proposed approach is confirmed by experiments on test and
real data. It is shown that this approach can significantly reduce the time and space costs
for the construction of the feature set and decision rules while maintaining an entry-level of
the system efficiency.
Статья поступила в редакцию 04.07.2012.
|
| id | nasplib_isofts_kiev_ua-123456789-57731 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-12-07T18:34:00Z |
| publishDate | 2012 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Волченко, Е.В. 2014-03-14T08:43:22Z 2014-03-14T08:43:22Z 2012 Метод совместного построения решающих правил и выбора словаря признаков 
 по взвешенным обучающим выборкам / Е.В. Волченко // Штучний інтелект. — 2012. — № 4. — С. 316-323. — Бібліогр.: 11 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/57731 004.93’11 В работе предложен новый подход к решению задачи совместного построения решающих правил классификации и рабочего словаря признаков в обучающихся системах распознавания, основанный на использовании взвешенных обучающих выборок. Описаны метод w-GridDC формирования взвешенной обучающей выборки w-объектов, алгоритм w-MIEF построения рабочего словаря признаков на её основе и модифицированный метод k-ближайших соседей для выполнения классификации объектов. Приведены результаты экспериментальных исследований, подтвердившие эффективность предложенного подхода. У роботі запропонований новий підхід до вирішення задачі побудови розвя’зувальних правил класифікації та робочого словника ознак у системах розпізнавання, що навчаються. Основою цього підходу є використання зважених навчальних вибірок. Наведено метод w-GridDC формування зваженої навчальної вибірки w-об’єктів, алгоритм w-MIEF побудови робочого словника ознак на її основі та модифікований метод k-найближчих сусідів для виконання класифікації об’єктів. Наведено результати експериментальних досліджень, що підтверджують ефективність запропонованого підходу. A new approach to solving the problem of joint constructing of classification decision rules and feature selection in the recognition training systems based on weighted training samples use is given in the article. W-GridDC method of forming a weighted training sample of w-objects, the algorithm w-MIEF of construction the feature set based on it, and a modified method of k-nearest neighbor for objects classification are described. Experimental results have confirmed the effectiveness of the proposed approach. ru Інститут проблем штучного інтелекту МОН України та НАН України Штучний інтелект Интеллектуальные системы планирования, управления, моделирования и принятия решений Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам Метод сумісної побудови розв’язувальних правил та словника ознак по зважених навчаючих вибірках Method of Joint Construction of Decision Rules and Feature Selection Based on Weighted Training Samples Article published earlier |
| spellingShingle | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам Волченко, Е.В. Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| title | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| title_alt | Метод сумісної побудови розв’язувальних правил та словника ознак по зважених навчаючих вибірках Method of Joint Construction of Decision Rules and Feature Selection Based on Weighted Training Samples |
| title_full | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| title_fullStr | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| title_full_unstemmed | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| title_short | Метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| title_sort | метод совместного построения решающих правил и выбора словаря признаков по взвешенным обучающим выборкам |
| topic | Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| topic_facet | Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/57731 |
| work_keys_str_mv | AT volčenkoev metodsovmestnogopostroeniârešaûŝihpravilivyboraslovarâpriznakovpovzvešennymobučaûŝimvyborkam AT volčenkoev metodsumísnoípobudovirozvâzuvalʹnihpraviltaslovnikaoznakpozvaženihnavčaûčihvibírkah AT volčenkoev methodofjointconstructionofdecisionrulesandfeatureselectionbasedonweightedtrainingsamples |