Классификация без учителя на основе неколичественно заданного критерия разделения классов

Предложен метод мультиклассовой классификации без учителя, основанный на аппарате алгебры логики. Метод предполагает исследование пространства возможных состояний объектов классификации на непротиворечивость, что позволяет существенно сократить размерность области существования объекта. В результате...

Повний опис

Збережено в:
Бібліографічні деталі
Опубліковано в: :Штучний інтелект
Дата:2012
Автор: Масалитина, Н.Н.
Формат: Стаття
Мова:Російська
Опубліковано: Інститут проблем штучного інтелекту МОН України та НАН України 2012
Теми:
Онлайн доступ:https://nasplib.isofts.kiev.ua/handle/123456789/60730
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Классификация без учителя на основе неколичественно заданного критерия разделения классов / Н.Н. Масалитина // Штучний інтелект. — 2012. — № 2. — С. 144-150. — Бібліогр.: 6 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1859610095387672576
author Масалитина, Н.Н.
author_facet Масалитина, Н.Н.
citation_txt Классификация без учителя на основе неколичественно заданного критерия разделения классов / Н.Н. Масалитина // Штучний інтелект. — 2012. — № 2. — С. 144-150. — Бібліогр.: 6 назв. — рос.
collection DSpace DC
container_title Штучний інтелект
description Предложен метод мультиклассовой классификации без учителя, основанный на аппарате алгебры логики. Метод предполагает исследование пространства возможных состояний объектов классификации на непротиворечивость, что позволяет существенно сократить размерность области существования объекта. В результате становится возможным применение качественного критерия разделения классов. Метод ориентирован на классификацию объектов, обладающих иерархической структурой управления. Запропоновано метод мультикласової класифікації без вчителя, заснований на апараті алгебри логіки. Метод передбачає дослідження простору можливих станів об’єктів класифікації на несуперечність, що дозволяє істотно скоротити розмірність області існування об’єкта. У результаті стає можливим застосування якісного критерію поділу класів. Метод орієнтований на класифікацію об’єктів, що володіють ієрархічною структурою управління. The multiclass categorization method without learning was proposed. Principles of Boolean algebra are in the base of the method. The method performs inconsistent descriptors combinations excluding. It allows reducing a dimensionality of an object existence area. As a result, the method allows using qualitative class division criteria. The method is orientated to the objects with a hierarchy structure.
first_indexed 2025-11-28T11:49:31Z
format Article
fulltext «Искусственный интеллект» 2’2012144 6М УДК 004.93'1 Н.Н. Масалитина Учреждение образования «Гомельский государственный технический университет имени П.О. Сухого», г. Гомель, Республика Беларусь Беларусь, 246746, г. Гомель, пр. Октября, 48, masalitina@rambler.ru Классификация без учителя на основе неколичественно заданного критерия разделения классов N.N. Masalitina P. Sukhoi Gomel State Technical University, Gomel Belarus Republic, 246746, Gomel, Pr. Octiabria, № 48 The Categorization Method without Learning Based on Qualitative Class Division Criteria Н.Н. Масалiтiна Установа освіти «Гомельський державний технічний університет ім. П.О. Сухого», м. Гомель, Республіка Білорусь Білорусь, 246746, м. Гомель, пр. Жовтня,48 Класифікація без вчителя на основі некількісних заданому критерію поділу класів Предложен метод мультиклассовой классификации без учителя, основанный на аппарате алгебры логики. Метод предполагает исследование пространства возможных состояний объектов классификации на непротиворечивость, что позволяет существенно сократить размерность области существования объекта. В результате становится возможным применение качественного критерия разделения классов. Метод ориентирован на классификацию объектов, обладающих иерархической структурой управления. Ключевые слова: мультиклассовая классификация, алгебра логики, качественные критерии The multiclass categorization method without learning was proposed. Principles of Boolean algebra are in the base of the method. The method performs inconsistent descriptors combinations excluding. It allows reducing a dimensionality of an object existence area. As a result, the method allows using qualitative class division criteria. The method is orientated to the objects with a hierarchy structure. Key Words: multiclass categorization, Boolean algebra, qualitative criteria. Запропоновано метод мультикласової класифікації без вчителя, заснований на апараті алгебри логіки. Метод передбачає дослідження простору можливих станів об’єктів класифікації на несуперечність, що дозволяє істотно скоротити розмірність області існування об’єкта. У результаті стає можливим застосування якісного критерію поділу класів. Метод орієнтований на класифікацію об’єктів, що володіють ієрархічною структурою управління. Ключові слова: мультикласова класифікація, алгебра логіки, якісні критерії. Введение Принятие решения во многих областях деятельности человека приводит к не- обходимости решения задачи классификации (распознавания образов): выявления принадлежности некоторого объекта к одной из групп, отличающихся по известному признаку. mailto:masalitina@rambler.ru Классификация без учителя на основе неколичественно заданного критерия... «Штучний інтелект» 2’2012 145 6М Определение принадлежности объекта к некоторой группе требует анализа боль- шого объема информации, часто приводит к сопоставлению противоречивых сведений, осложняется невозможностью проведения натурных экспериментов над рядом объектов управления. При этом в таких областях, как медицинская диагностика, идентификация личности, защита от атак компьютерных вирусов, управление производственными систе- мами возникают особые требования к скорости распознавания, так как время на принятие решения и его практическое воплощение ограничено. Перечисленные особенности опре- деляют необходимость математического моделирования и автоматизации процесса класси- фикации объектов управления различной природы. Существующие в настоящее время подходы к решению задач классификации можно выделить пары принципиально различных групп: 1) по количеству выделяемых классов: методы бинарной и мультиклассовой классификации; 2) по способу формализации классификатора: классификация с учителем и без учителя. Бинарная классификация позволяет разделять множество исследуемых объектов на два подмножества (класса) [1], [2]. Задачи, требующие выделения более чем двух подмножеств, решаются на основе методов мультиклассовой классификации [3], [4]. Методы классификации с учителем реализуют формализацию правила разделения подмножеств на основе обобщения информации о значениях ряда показателей (дескрип- торов) объектов, принадлежность которых к данным подмножествам задана [1], [3], [4]. При этом необходима достоверная информация о составе классов и о значениях всех входных и выходных параметрах модели по достаточно большому множеству объектов, которое принято называть обучающей выборкой или группой эталонов. Такие методы допускают использование описаний объектов классификации и правил их разделения на группы в любой форме: количественной и качественной, непрерывной и дискретной. Основная сложность при использовании методов, основанных на обучении, определяет- ся сложностью обеспечения репрезентативности обучающей выборки в особенности в долгосрочной перспективе. Методы второй группы позволяют выявлять среди исследуемых объектов наи- более похожие по некоторым показателям. В этом случае классификация выполняется на основе вычисления различных расстояний между значениями дескрипторов [5], [6]. Природа родства между объектами различных классов остается необъяснимой. Состав классов может быть и неизвестен на начальных этапах исследования, однако критерии их разделения обязательно должны быть заданы в количественной форме. Преиму- ществом методов классификации без учителя является скорость и независимость от истории исследуемых объектов. Практика управления часто приводит к задачам классификации объектов, для которых характерна высокая скорость изменения структуры, поэтому неэффективны методы, требующие обучения. Необходимость классификации по критерию, задан- ному в неколичественной форме, либо невозможность заранее сформировать полный перечень классов приводит к задаче, решение которой на основе существующих ме- тодов неэффективно. Задача классификации с неизвестным составом алфавита классов и качествен- ным критерием их разделения решена автором на примере управления устойчи- востью систем, обладающих иерархической структурой. К числу таких систем отно- сятся субъекты хозяйствования, компьютерные сети, функциональные системы живых организмов в аспекте управления ходом лечения заболеваний и проч. В качестве Масалитина Н.Н. «Искусственный интеллект» 2’2012146 6М А неколичественного критерия разделения классов выбрано следующее условие: элементы различных классов должны принципиально отличаться возможностями и целями уп- равления устойчивостью. Целю работы – получить метод мультиклассовой классификации систем с иерар- хической структурой управления (СИСУ), допускающий использование неколичествен- ного описания критериев разделения классов и не требующий априорной информации о составе множества классов и о принадлежности к классам ряда реальных объектов. Постановка задачи – формализовать правило, разделяющее множество СИСУ на n классов bi (i=1..n, где n – количество классов), таких, что элементы каждого класса bi отличались от элементов каждого другого класса bj (j=1..n, j ≠ i) по кри- терию dij – в состав множества Mti управляющих воздействий, необходимых для по- вышения устойчивости объекта класса bi, входят элементы, не входящие в множество Mtj управляющих воздействий, необходимых для элементов класса bj. Методы исследования Выбор методов исследования определяется спецификой исследуемой предметной области – управления устойчивостью систем, характеризующихся иерархическими взаимосвязями. Данное исследование строится на информации о исправности (надле- жащем функционировании) отдельных элементов системы и о используемых при управ- лении механизмах. Особенностью указанных показателей является удобство представ- ления в двоичной форме (1 – элемент исправен, управляющее воздействие применяется, механизм достаточно эффективен, 0 – неисправен, не используется, не эффективен) и как следствие возможность применения методов алгебры логики. Иерархические взаимосвязи также легко представляются в виде матриц инцидентности, представляемых в двоичной форме. Двоичная форма показателей, используемых для описания состояния системы, определяет выбор методов алгебры логики. К числу существенных преимуществ данных методов относится легкая автоматизация и аппаратная реализация, хорошая проработанность приемов доказательства и опровержения [2]. Результаты исследования Разработанный автором метод мультиклассовой классификации предполагает последовательное прохождение ряда основных этапов, представленных на рис. 1. Первый этап метода предполагает составление описания СИСУ с помощью ряда дескрипторов, представляемых в двоичной форме: )...,,...,,...,( 212121 kmn ENENENDDDIIIsb  где nIII ..., 21 – показатели исправности i-й подсистемы (i=1..n, n – количество подсистем, учитываемых при моделировании), принимающие значение 1, если под- система исправна и 0 – в противном случае; mDDD ..., 21 – показатели активности i-го механизма управления (i=1..m, m – количество управляющих механизмов, учитываемых при моделировании), принима- ющий значение 1, если механизм применяется; 0 – если механизм не задействован; kENENEN ..., 21 – показатели, описывающие требования внешнего регулирования, принимающие значение 1, если объект соответствует некоторым нормам внешнего регулирования, 0 – в противном случае (индекс i определяет возможность рассматри- вать k различных аспектов внешнего регулирования). Классификация без учителя на основе неколичественно заданного критерия... «Штучний інтелект» 2’2012 147 6М Рисунок 1 – Графическая схема алгоритма метода классификации без учителя на основе неколичественно заданного критерия разделения классов На втором этапе выполняется описание всех возможных состояний систем, что равнозначно составлению всех возможных сочетаний n+m+k двоичных признаков. В ре- зультате будет получено 2n+m+k возможных сочетаний. Описание области существования объекта классификации удобно представить в форме матрицы Sb размерностью (n+m+k)×(2 n+m+k). Решение практических задач приводит к составлению матриц большой размерности, т.к. адекватное описание большинства СИСУ требует десятков показателей. Количество возможных сочетаний достигает нескольких тысяч. Масалитина Н.Н. «Искусственный интеллект» 2’2012148 6М А Однако значительная часть таких сочетаний невозможна в реальных условиях. С целью исключения противоречивых комбинаций предложенный метод предусматри- вает анализ взаимосвязей между показателями I, D и EN. Результатом является форма- лизация множества запрета Z – правил, ограничивающих возможные сочетания значений дескрипторов [2]. Составление множества запрета в общем случае – сложная эвристическая задача, требующая детальных знаний о структуре и функционировании объекта классификации. С целью упрощения данного этапа метод предполагает последовательный поиск взаимо- связей различной природы и формализацию запретов следующих групп: 1) запреты физических противоречий ZP, определяемые физическими законами существования и взаимодействия подсистем СИСУ; 2) запреты иерархии ZH являются следствием иерархических связей между подсистемами СИСУ; 3) запреты рационального управления ZRM, описывающие логику управления, нацеленного на повышение устойчивости, и применение для этого наиболее эффектив- ных средств; 4) запреты внешнего регулирования ZEN, т.е. ограничения возможностей функцио- нирования и управления СИСУ со стороны внешних сил (законодательной системы, морально-этических норм, охраны труда и проч.). Исключение из множества возможных состояний СИСУ такие сочетания дес- крипторов, которые соответствуют области запрета Z, позволяет на один-два порядка сократить количество столбцов матрицы Sb. Полученная в результате матрица ZSb содержит полные с точки зрения выбран- ной модели СИСУ описания состояний классифицируемых объектов. Сравнение этих описаний объединение их в группы, наиболее соответствующие требованиям крите- рия d позволяет сформировать ряд возможных алфавитов классов. Если среди предложенных алфавитов классов нет соответствующего требова- ниям лица, принимающего решение (ЛПР), то построение классификатора в рамках существующего набора дескрипторов sb невозможно. Решение поставленной задачи в этом случае требует развития модели, используемой для описания состояния СИСУ, и повторения всех перечисленных выше этапов построения классификатора на основе другого множества показателей sb. Если среди составленных алфавитов классов найден хотя бы один, удовлетво- ряющий требованиям лица, принимающего решение (ЛПР), то метод предполагает выявление среди дескрипторов sb таких показателей sb', значения которых позволяют идентифицировать объекты различных классов. Классификатор в результате представляет собой дизъюнктивную нормальную форму [2] от показателей sb'. Классификатор в дизъюнктивной форме может использоваться как для бинарной классификации [5], так и для мультиклассовой. В этом случае число «слагаемых» должно быть на единицу меньше количества классов w. Тогда функция-классифи- катор сможет принимать значения от 0 до w-1, что достаточно для разделения w классов. Завершение разработки классификатора требует формализации правил расчета обобщенных дескрипторов sb', используемых при построении классификатора. Данный этап необходим, т.к. не всегда показатели sb', позволяющие оптимально классифици- ровать СИСУ, поддаются непосредственному наблюдению. Определение значений многих величин требует дополнительных исследований или применения специаль- Классификация без учителя на основе неколичественно заданного критерия... «Штучний інтелект» 2’2012 149 6М ных средств измерения, выбор которых в значительной степени определяет качество дальнейшей классификации. Для измерения отдельных обобщенных дескрипторов необходимо рассчитать или измерять несколько показателей. Результатом является множество легко измеримых показателей G, а также правила T(G), регламентирую- щие оценку показателей sb' по заданным значениям показателей G: ')( sbGT  . Двухэтапная процедура отбора показателей оправдана, так как применение на начальных этапах исследования обобщенных дескрипторов sb' предоставляет пре- имущества «прозрачности» при описании состояния СИСУ и при составлении мно- жества запрета, а также позволяет получать более простые классификаторы. На за- вершающих этапах исследования необходимы легко измеримые показатели G, с целью исключения ошибок оценки входных параметров модели. Составление мно- жеств G и T на последнем этапе разработки модели классификации значительно эко- номичнее, так как позволяет работать с показателями sb', количество которых в не- сколько раз меньше, чем sb, используемых на первых этапах. Выводы Таким образом, в результате проведенных исследований получен метод класси- фикации, обладающий следующими особенностями: 1) не требует предварительного обучения на эталонной выборке, что сущест- венно сокращает время разработки модели классификации и исключает влияние ошибки репрезентативности обучающей выборки; 2) позволяет разделять классифицируемое множество на два и более подмножеств. Количество возможных классов определяется количеством непротиворечивых сочетаний значений двоичных показателей, используемых для описания состояния СИСУ; 3) учитывает ограничения определяемые иерархией подсистем объекта класси- фикации, физическими законами его функционирования, логикой рационального уп- равления и нормами внешнего регулирования; 4) позволяет разделять объекты не произвольным случайным образом, а в соот- ветствии с заданным критерием классификации; 5) позволяет использовать критерии разделения классов, заданные в произволь- ном виде, и при этом не требует упрощения задачи с целью приведения критерия к количественной форме; 6) позволяет получать классификатор в дизъюнктивной нормальной форме, что раскрывает широкие возможности автоматизированной и аппаратной реализации предложенного метода классификации. В результате полученный метод предоставляет возможности решения задач, в равной степени недоступных для классических методов классификации с учителем и без учителя – задач с неполной информацией о составе классов, содержащих кач- ественные критерии разделения классов. Литература 1. Закревский, Д.А. Логика распознавания / Закревский Д.А. – Мн. : Наука и техника, 1988. – 118 с. 2. Чень Ч. Математическая логика и автоматическое доказательство теорем / Чень Ч. – М. : Наука, 1983. – 358с. Масалитина Н.Н. «Искусственный интеллект» 2’2012150 6М А 3. Головко В.А. Нейросетевые методы обучения и обработки информации в системах управления и прогнозирования : дис. ... д-ра тех. наук : 05.13.01 ; защ. : 14.01.03 ; утв. : 24.09.03 / Головко В.А. – Мн., 2002. 4. Корноушенко Е.В. Адаптивный алгоритм мультиклассовой классификации / Е.В. Корноушенко, А.А. Лобко // Международный конгресс по информатике: информационные системы и технологии = International Congress on Computer Science: Information Systems and Tecnologies : материалы между- народного научного конгресса, (Республика Беларусь, Минск, 31 окт. – 3 нояб. 2011 г.) : в 2 ч. Ч. 1 / редкол. : С.В. Абломейко (отв. Ред.) [и др.]. – Мн. : БГУ, 2011. – С.81-85. 5. Айвазян С.А. Прикладная статистика: Классификация и снижение размерности : справ. изд. / С.А. Айвазян, В.М. Бухштабер, И.Е. Енюков, Л.Д. Мешалкин; под ред. С.А. Айвазяна. – М. : Финансы и статистика, 1989. – 607 с. 6. Мандель И.Д. Кластерный анализ / Мандель И.Д. – М. : Финансы и статистика, 1988. – 176 с. Literatura 1. Zakrevskij D.A. Logika raspoznavanija. Mn.: Nauka i tehnika. 1988. 118 s. 2. Chen’ Ch. Matematicheskaja logika i avtomaticheskoe dokazatel’stvo teorem. M.: Nauka. 1983. 358 s. 3. Golovko V.A. Nejrosetevye metody obuchenija i obrabotki informacii v sistemah upravlenija i prognozirovanija: Dis. na soisk. uchen. step. d-ra tehn. nauk: 05.13.01: Zashhishhena 14.01.03: Utv. 24.09.03 Mn. 2002. 4. Kornoushenko E.V. International Congress on Computer Science: Information Systems and Tecnologies: materialy mezhdunarodnogo nauchnogo kongressa, Respublika Belarus’, Minsk, 31 okt.-3 nojab. 2011 g. Mn.: BGU. 2011. S.81-85. 5. Ajvazjan S.A. Prikladnaja statistika: Klassifikacija i snizhenie razmernosti: Sparv. izd. M.: Finansy i statistika. 1989. 607 s. 6. Mandel’ I. D. Klasternyj analiz. M.: Finansy i statistika. 1988. 176 s. N.N. Masalitina The Categorization Method without Learning Based on Qualitative Class Division Criteria The results of solving the problem of categorization based on qualitative class division criteria are presented. The developed method allows to recognize more than two classes. The method is based on the prohibition ensemble analysis. It allows to reduce a dimen- sionality of an object existence area and to unite objects in groups differ by a given criterion. As a result, the method allows to solve semiformalized problems of categorization when infor- mation about model inputs and outputs is not full. The method does not require a learning stage. The whole class alphabetic is formed in a process of model synthesis and may be changed on any stage of development. The method is orientated to the objects with a hierarchy structure (production systems, computing networks, organism and its functional subsystems in a treatment process and others). The use of Boolean algebra principles gives wide possibility for automation of deve- loping categorization models. Статья поступила в редакцию 26.04.2012.
id nasplib_isofts_kiev_ua-123456789-60730
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-11-28T11:49:31Z
publishDate 2012
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Масалитина, Н.Н.
2014-04-19T11:41:26Z
2014-04-19T11:41:26Z
2012
Классификация без учителя на основе неколичественно заданного критерия разделения классов / Н.Н. Масалитина // Штучний інтелект. — 2012. — № 2. — С. 144-150. — Бібліогр.: 6 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/60730
004.93'1
Предложен метод мультиклассовой классификации без учителя, основанный на аппарате алгебры логики. Метод предполагает исследование пространства возможных состояний объектов классификации на непротиворечивость, что позволяет существенно сократить размерность области существования объекта. В результате становится возможным применение качественного критерия разделения классов. Метод ориентирован на классификацию объектов, обладающих иерархической структурой управления.
Запропоновано метод мультикласової класифікації без вчителя, заснований на апараті алгебри логіки. Метод передбачає дослідження простору можливих станів об’єктів класифікації на несуперечність, що дозволяє істотно скоротити розмірність області існування об’єкта. У результаті стає можливим застосування якісного критерію поділу класів. Метод орієнтований на класифікацію об’єктів, що володіють ієрархічною структурою управління.
The multiclass categorization method without learning was proposed. Principles of Boolean algebra are in the base of the method. The method performs inconsistent descriptors combinations excluding. It allows reducing a dimensionality of an object existence area. As a result, the method allows using qualitative class division criteria. The method is orientated to the objects with a hierarchy structure.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Штучний інтелект
Нейронные сети и нейросетевые технологии. Информационная безопасность ИС
Классификация без учителя на основе неколичественно заданного критерия разделения классов
Класифікація без вчителя на основі некількісних заданому критерію поділу класів
The Categorization Method without Learning Based on Qualitative Class Division Criteria
Article
published earlier
spellingShingle Классификация без учителя на основе неколичественно заданного критерия разделения классов
Масалитина, Н.Н.
Нейронные сети и нейросетевые технологии. Информационная безопасность ИС
title Классификация без учителя на основе неколичественно заданного критерия разделения классов
title_alt Класифікація без вчителя на основі некількісних заданому критерію поділу класів
The Categorization Method without Learning Based on Qualitative Class Division Criteria
title_full Классификация без учителя на основе неколичественно заданного критерия разделения классов
title_fullStr Классификация без учителя на основе неколичественно заданного критерия разделения классов
title_full_unstemmed Классификация без учителя на основе неколичественно заданного критерия разделения классов
title_short Классификация без учителя на основе неколичественно заданного критерия разделения классов
title_sort классификация без учителя на основе неколичественно заданного критерия разделения классов
topic Нейронные сети и нейросетевые технологии. Информационная безопасность ИС
topic_facet Нейронные сети и нейросетевые технологии. Информационная безопасность ИС
url https://nasplib.isofts.kiev.ua/handle/123456789/60730
work_keys_str_mv AT masalitinann klassifikaciâbezučitelânaosnovenekoličestvennozadannogokriteriârazdeleniâklassov
AT masalitinann klasifíkacíâbezvčitelânaosnovínekílʹkísnihzadanomukriteríûpodíluklasív
AT masalitinann thecategorizationmethodwithoutlearningbasedonqualitativeclassdivisioncriteria