Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки
В статье рассматривается метод построения компьютерной системы диагностики на основе алгоритмов распознавания образов и кластерного анализа. Предлагается, используя исходные множество диагностируемых состояний и набор наблюдаемых характеристик, сформировать априорный словарь признаков и построить об...
Збережено в:
| Опубліковано в: : | Штучний інтелект |
|---|---|
| Дата: | 2012 |
| Автори: | , , |
| Формат: | Стаття |
| Мова: | Російська |
| Опубліковано: |
Інститут проблем штучного інтелекту МОН України та НАН України
2012
|
| Теми: | |
| Онлайн доступ: | https://nasplib.isofts.kiev.ua/handle/123456789/57748 |
| Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Цитувати: | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки / В.Г. Родченко, Е.В. Олизарович, А.И. Жукевич // Штучний інтелект. — 2012. — № 4. — С. 381-386. — Бібліогр.: 9 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraine| _version_ | 1859658797282230272 |
|---|---|
| author | Родченко, В.Г. Олизарович, Е.В. Жукевич, А.И. |
| author_facet | Родченко, В.Г. Олизарович, Е.В. Жукевич, А.И. |
| citation_txt | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки / В.Г. Родченко, Е.В. Олизарович, А.И. Жукевич // Штучний інтелект. — 2012. — № 4. — С. 381-386. — Бібліогр.: 9 назв. — рос. |
| collection | DSpace DC |
| container_title | Штучний інтелект |
| description | В статье рассматривается метод построения компьютерной системы диагностики на основе алгоритмов распознавания образов и кластерного анализа. Предлагается, используя исходные множество диагностируемых состояний и набор наблюдаемых характеристик, сформировать априорный словарь признаков и построить обучающую выборку, а затем на основе анализа данных этой выборки сформировать такое пространство решений, в котором формальные образы эталонов диагностируемых состояний разделены и компактны.
У статті розглядається метод побудови комп’ютерної системи діагностики на основі алгоритмів розпізнавання образів і кластерного аналізу. Пропонується, використовуючи вхідний набір станів, що діагностуються, і набір спостережуваних характеристик, сформувати апріорний словник ознак і побудувати навчальну вибірку, а потім, на основі аналізу даних цієї вибірки, сформувати такий простір рішень, в якому формальні образи еталонів станів, що діагностуються, розподілені й компактні.
In the article, the construction method of the computer diagnostics systems based on algorithms of pattern recognition and cluster analysis is considered. It is proposed, using the original set of diagnostic conditions and the one of observable characteristics, to form a priori features vocabulary and to build a training sample, and then on the basis of the analysis of the sample data to form such kind of solution space, in which the formal images of the standards of diagnosed conditions are separated and compact.
|
| first_indexed | 2025-11-30T09:16:41Z |
| format | Article |
| fulltext |
«Штучний інтелект» 4’2012 381
4Р
УДК 004.891.3:004.93
В.Г. Родченко, Е.В. Олизарович, А.И. Жукевич
Гродненский государственный университет имени Янки Купалы, г.Гродно, Беларусь
Республика Беларусь, г. Гродно, 230023, ул. Ожежко, 22
rovar@mail.ru, e.olizarovich@grsu.by, san@grsu.by
Метод построения компьютерной системы
диагностики на основе анализа данных
обучающей выборки
V.G. Rodchenko, E.V.Olizarovich, A.I. Zhukevich
Yanka Kupala State University of Grodno, c.Grodno, Belarus
Belarus, Grodno, 230023, 22 Ozheshko str.
rovar@mail.ru, e.olizarovich@grsu.by, san@grsu.by
The Construction Method of the Computer Diagnostics
Systems Based on the Analysis of Training Sample Data
В.Г. Родченко, Є.В. Олизарович, О.І. Жукевич
Гродненський державний університет імені Янки Купали, м. Гродно, Білорусь
Республіка Білорусь, м. Гродно, 230023, вул. Ожежко, 22
rovar@mail.ru, e.olizarovich@grsu.by, san@grsu.by
Метод побудови комп’ютерної системи діагностики на
основі аналізу даних вибірки, що навчає
В статье рассматривается метод построения компьютерной системы диагностики на основе алгоритмов
распознавания образов и кластерного анализа. Предлагается, используя исходные множество диагности-
руемых состояний и набор наблюдаемых характеристик, сформировать априорный словарь признаков и
построить обучающую выборку, а затем на основе анализа данных этой выборки сформировать такое
пространство решений, в котором формальные образы эталонов диагностируемых состояний разделены и
компактны.
Ключевые слова: компьютерная система диагностики, кластерный анализ,
множество диагностируемых состояний.
In the article, the construction method of the computer diagnostics systems based on algorithms of pattern
recognition and cluster analysis is considered. It is proposed, using the original set of diagnostic conditions
and the one of observable characteristics, to form a priori features vocabulary and to build a training sample,
and then on the basis of the analysis of the sample data to form such kind of solution space, in which the
formal images of the standards of diagnosed conditions are separated and compact.
Key words: computer system of diagnostics, cluster analysis, great number of the diagnosed states.
У статті розглядається метод побудови комп’ютерної системи діагностики на основі алгоритмів розпізнаван-
ня образів і кластерного аналізу. Пропонується, використовуючи вхідний набір станів, що діагностуються, і
набір спостережуваних характеристик, сформувати апріорний словник ознак і побудувати навчальну ви-
бірку, а потім, на основі аналізу даних цієї вибірки, сформувати такий простір рішень, в якому формальні
образи еталонів станів, що діагностуються, розподілені й компактні.
Ключові слова: комп’ютерна система діагностики, кластер ний аналіз, множина станів,
що діагностуються.
Родченко В.Г., Олизарович Е.В., Жукевич А.И.
«Искусственный интеллект» 4’2012 382
4Р
Введение
Компьютерные системы диагностики (КСД) разного уровня сложности и направ-
ленности традиционно уже достаточно давно нашли свое применение в медицине и
технике [1-3].
В последнее же время область их использования существенно расширилась и ох-
ватывает такие отрасли знаний, как психологию, социологию, текстологию, экономику и
др. [4], [5].
При исследовании закономерностей поведения сложных систем и при решении
задач диагностики состояний таких систем специалисты сталкиваются с необходимостью
одновременного учета большого количества разнообразных признаков.
В этом случае применение классического математического аппарата оказывается
весьма ограниченным и затруднительным из-за сложности природы изучаемых явлений
и объектов.
Использование же подходов, которые базируются на методах и алгоритмах прик-
ладной статистики, теории распознавания образов и кластерного анализа, позволяет
находить более эффективные решения как в случае изучения закономерностей поведения
сложных систем, так и в случае построения соответствующих прикладных систем диаг-
ностики [6], [7].
Целью данной работы является разработка метода построения компьютерной
системы диагностики, в рамках которого на основе задаваемого множества диагности-
руемых состояний и набора наблюдаемых характеристик последовательно формируют-
ся априорный словарь признаков и классифицированная обучающая выборка (КОВ), а
затем, путем анализа содержимого этой выборки, выполняется процедура обучения и в
результате формируется такое пространство решений, в котором формальные образы
эталонов диагностируемых состояний представляют собой компактные и разделенные
кластеры.
Постановка задачи
Процесс выполнения компьютерной диагностики на основе анализа наблюда-
емых данных предлагается реализовать в три этапа, первый из которых является
подготовительным и связан с формированием априорного словаря признаков и по-
строением обучающей выборки.
На втором этапе необходимо реализовать процедуру обучения, в результате вы-
полнения которой из априорного словаря исключаются все малоинформативные приз-
наки, не обеспечивающие разделение формальных образов эталонов диагностируемых
состояний в соответствующем признаковом пространстве принятия решений.
Заключительный третий этап связан с выполнением процедуры принятия реше-
ния – постановки диагноза.
Формально процесс компьютерной диагностики на основе анализа наблюдаемых
данных может быть реализован в результате выполнения следующей последовательности
преобразований:
REATACS FFFFFF 654321 * , (1)
где S – множество диагностируемых состояний; С – словарь наблюдаемых
(измеряемых) характеристик (СНХ);
A – априорный словарь признаков;
T – классифицированная обучающая выборка;
Метод построения компьютерной системы диагностики на основе анализа…
«Штучний інтелект» 4’2012 383
4Р
A* – уточненный словарь признаков для построения пространства решений;
E – множество эталонов диагностируемых состояний;
R – множество решений;
F1 – алгоритм получения наблюдаемых характеристик;
F2 – алгоритм построения априорного словаря признаков;
F3 – алгоритм формирования классифицированной обучающей выборки;
F4 – алгоритм сепарирования признаков из априорного словаря по степени их
информативности для построения пространства решений;
F5 – алгоритм построения образов эталонов диагностируемых состояний в
пространстве решений;
F6 – алгоритм постановки заключительного диагноза.
Итак, пусть имеется множество диагностируемых состояний S={S1,S2,...,Sk} и
набор наблюдаемых характеристик С={С1,С2,...,Сp}.
Для построения КСД требуется предусмотреть решение следующих задач.
1 На основе имеющегося набора наблюдаемых характеристик С={С1,С2,...,Сp}
сформировать априорный словарь признаков A={A1,A2,...,An} и затем, в соответствии
с множеством диагностируемых состояний S={S1,S2,...,Sk}, построить классифицирован-
ную обучающую выборку T.
2 Анализируя содержимое классифицированной обучающей выборки, реализовать
процедуру обучения с целью сепарирования признаков по степени их информативности
с точки зрения разделения образов эталонов диагностируемых состояний в пространстве
принятия решений.
3 Реализовать механизм постановки заключительного диагноза на основе
использования построенных эталонов диагностируемых состояний в пространстве
принятия решений.
Описание этапов работы КСД
Схематично этапы работы компьютерной системы диагностики на основе ана-
лиза наблюдаемых данных изображены на рис. 1.
Рисунок 1 – Схема этапов работы компьютерной системы диагностики
Родченко В.Г., Олизарович Е.В., Жукевич А.И.
«Искусственный интеллект» 4’2012 384
4Р
Процесс постановки диагноза конкретной прикладной компьютерной системой
диагностики начинается с определения множества диагностируемых состояний
S={S1,S2,...,Sk} и формирования исходного словаря наблюдаемых характеристик
С={С1,С2,...,Сp}. Решение этой задачи должно выполняться специалистами, являющимися
экспертами в соответствующей прикладной области знаний. Предложить универса-
льный механизм для решения указанной задачи выступает нетривиальной пробле-
мой, а потому в данном случае опираются на накопленный экспертами практический
опыт и на привлечение аналитиков, являющихся специалистами в области примене-
ния компьютерных методов анализа данных [8].
Отметим, что словарь наблюдаемых характеристик будет представлять собой
выборку из соответствующей предметной области генерального словаря. С одной
стороны, для обеспечения более высокой результативности работы КСД необходимо
стремится к тому, чтобы СНХ содержал как можно большее число характеристик.
С другой стороны, это будет приводить к возрастанию стоимостных, временных и
других издержек. Конечным результатом совместной работы экспертов и аналитиков
будет являться сформированный априорный словарь признаков A={A1,A2,...,An}.
Переходим к построению обучающей выборки. Каждое диагностируемое
состояние Si (где i = k,1 ) формально описывается множеством из mi (где i = k,1 )
наблюдений, причем каждое отдельное наблюдение значений признаков из априорного
словаря признаков представляется в виде вектора-столбца t =
nt
t
t
...
2
1
.
Объединение всех таких векторов для всех Si (где i = k,1 ) образуют клас-
сифицированную обучающую выборку T, которая представляет собой прямоугольную
матрицу размерности n x m, где m = m1+ m2+…+mk, а mi – количество наблюдений для
состояния Si (где i = k,1 ). При этом каждому SiS, где i = k,1 , соответствует матрица Ti
размерности n x mi.
Выполняется анализ содержимого априорного словаря путем сепарирования
признаков по степени информативности с точки зрения разделения формальных
образов состояний Si (где i = k,1 ) в многомерном признаковом пространстве.
В результате, признаки из априорного словаря A = {A1,A2,...,An} разбиваются на три
вида A(1) = {A1
(1),A2
(1),...,An1
(1)}, A(2) = {A1
(2),A2
(2),...,An2
(2)}, A(3) = {A1
(3), A2
(3),...,An3
(3)},
где A = A(1) A(2) A(3) и n1+n2+n3=n.
Очередной признак Ai (где i = n,1 ) будет отнесен к одному из трех видов на
основе выполнения одного из следующих трех условий:
1) если для всех пар (Sq,Sj) (где q= k,1 ; i= k,1 ; q≠i) соответствующий критерий
однородности не показал существенного различия между выборками значений этого
признака, то Ai является признаком первого вида;
2) если для всех пар (Sq,Sj) (где q= k,1 ; i= k,1 ; q≠i) соответствующий критерий
однородности показал существенное различие между выборками значений этого
признака, то Ai является признаком второго вида;
3) если же для признака Ai не выполнилось ни одно из двух предыдущих
условий, то его следует отнести к третьему виду [9].
Метод построения компьютерной системы диагностики на основе анализа…
«Штучний інтелект» 4’2012 385
4Р
Для дальнейшего использования в уточненный словарь A* включаются только
признаки второго вида, т.е. A*={A1
(2),A2
(2),...,An2
(2)}. Переход к построению эталонов
диагностируемых состояний происходит только в том случае, когда словарь
признаков A* оказывается непустым, а иначе необходимо вернуться и сформировать
новый вариант априорного словаря.
Процедура построения эталонов диагностируемых состояний начинается с
того, что из матриц T1,T2,...,Tk исключаются строки, содержащие значения признаков
первого A(1) и третьего A(3) видов, и параллельно все соответствующие значения
признаков второго вида нормируются к единичному интервалу по формуле:
eij=(tij – mini))/(maxi – mini) i= 2,1 n ; j= im,1 , (2)
где mini – минимальное значение среди всех tij в i-ой строке, а maxi –
максимальное значение среди всех tij в i-ой строке.
В результате получаются матрицы E1,E2,...,Ek размерности n2 x mi, которые
представляют собой образы эталонов диагностируемых состояний. Процедура поста-
новки заключительного диагноза начинается с того, что диагностируемый объект
формально описывается на основе признаков из уточненного словаря A*={A1
(2),A2
(2),...,
An2
(2)} в виде матрицы E* размерности n2 x m*, где m* – количество наблюдений для
диагностируемого объекта. Используя матрицы E1,E2,...,Ek и E* можно сформировать
соответственно эталоны-кластеры и кластер диагностируемого объекта, а затем осу-
ществить постановку заключительного диагноза на основе оценки взаимного размеще-
ния кластеров. Для кластера E* определяется самый ближайший Ei из всех E1,E2,...,Ek, и
тогда искомым результатом будет являться состояние Si.
Выводы
Разработан метод построения компьютерной системы диагностики на основе
анализа данных классифицированной обучающей выборки, который базируется на
использовании аппарата распознавания образов и кластерного анализа. Качественное
выполнение процедуры постановки заключительного диагноза обеспечивается за счет
реализации процедуры обучения. Этой процедурой предусматривается сепарирование
признаков из исходного априорного словаря по степени информативности с точки
зрения разделения эталонов диагностируемых состояний в многомерном признаковом
пространстве принятия решений.
Предложенный метод построения компьютерных систем диагностики является
универсальным с точки зрения применения в различных прикладных областях. Он
предусматривает автоматическое выполнение процедур обучения и постановки диаг-
ноза, и при этом позволяет диагностировать состояния на основе анализа различных по
своей природе исходных признаков.
Ограничения метода в первую очередь связаны с тем, что при решении реальных
задач может возникать ситуация, когда словарь информативных признаков для по-
строения пространства решений оказывается пустым.
Литература
1. Быстров Ю.Г. Компьютерная рефлексодиагностика – программное обеспечение автоматизированной
диагностической системы «электроника–прогноз» / Ю.Г. Быстров, В.П. Злоказов, А.Л. Розанов //
Программные продукты и системы. – 1988. – № 3. – С. 42-49.
2. Васильев В.И. Проблема обучения распознаванию образов / Васильев В.И. – К. : Вища шк.,
1989. – 64 с.
Родченко В.Г., Олизарович Е.В., Жукевич А.И.
«Искусственный интеллект» 4’2012 386
4Р
3. Гуща Ю.В. Об использовании одного алгоритма кластерного анализа при построении системы
диагностики острого аппендицита у детей / Ю.В. Гуща // Известия Гомельского государственного
университета имени Ф. Скорины. – 2007. – № 5. – С. 21-26.
4. Дюк В.А. Компьютерная психодиагностика / Дюк В.А. – СПб. : «Братство», 1994. – 364 с.
5. Марусенко М.А. Атрибуция анонимных и псевдоанонимных литературных произведений методами
распознавания образов / Марусенко М.А. – Л. : Издательство Ленинградского университета, 1990. – 168 с.
6. Загоруйко Н.Г. Прикладные методы анализа данных и знаний / Загоруйко Н.Г. – Новосибирск :
Изд-во Института математики, 1999. – 270 с.
7. Журавлёв Ю.И. Избранные научные труды / Журавлев Ю.И. – М. : Магистр, 1998. – 420 с.
8. Джарратано Дж. Экспертные системы: принципы разработки и программирование / Дж. Джарратано,
Г. Райли; – М. : ООО «И.Д. Вильямс», 2007. – 1152 с.
9. Родченко В.Г. Об одном методе реализации процедуры обучения при построении системы
распознавания образов / В.Г. Родченко // Известия Гомельского государственного университета
имени Ф. Скорины. – 2006. – № 4. – С. 73-76.
Literatura
1. Bystrov Ju.G. Programmnye produkty i sistemy. 1988. № 3. S. 42-49.
2. Vasil’ev V.I. Problema obuchenija raspoznavaniju obrazov. K.: Vyshha shk. Golovnoe izd-vo. 1989. 64 s.
3. Gushha Ju.V. Izvestija Gomel’skogo gosudarstvennogo universiteta imeni F.Skoriny. 2007. № 5. S. 21-26.
4. Djuk V.A. Komp’juternaja psihodiagnostika. SPb.: “Bratstvo”. 1994. 364 s.
5. Marusenko M.A. Atribucija anonimnyh i psevdoanonimnyh literaturnyh proizvedenij metodami
raspoznavanija obrazov. L.: Izdatel’stvo Leningradskogo universiteta. 1990. 168 s.
6. Zagorujko N.G. Prikladnye metody analiza dannyh i znanij. Novosibirsk: Izd-vo Instituta matematiki.1999. 270 s.
7. Zhuravljov Ju.I. Izbrannye nauchnye Trudy. M.: Magistr. 1998. 420 s.
8. Dzharratano Dzh. Jekspertnye sistemy: principy razrabotki i programmirovanie. M.: OOO “I.D. Vil’jams”.
2007. 1152 s.
9. Rodchenko V.G. Izvestija Gomel'skogo gosudarstvennogo universiteta imeni F.Skoriny. 2006. № 4. S. 73-76.
Статья поступила в редакцию 31.05.2012.
|
| id | nasplib_isofts_kiev_ua-123456789-57748 |
| institution | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| issn | 1561-5359 |
| language | Russian |
| last_indexed | 2025-11-30T09:16:41Z |
| publishDate | 2012 |
| publisher | Інститут проблем штучного інтелекту МОН України та НАН України |
| record_format | dspace |
| spelling | Родченко, В.Г. Олизарович, Е.В. Жукевич, А.И. 2014-03-14T13:17:57Z 2014-03-14T13:17:57Z 2012 Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки / В.Г. Родченко, Е.В. Олизарович, А.И. Жукевич // Штучний інтелект. — 2012. — № 4. — С. 381-386. — Бібліогр.: 9 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/57748 004.891.3:004.93 В статье рассматривается метод построения компьютерной системы диагностики на основе алгоритмов распознавания образов и кластерного анализа. Предлагается, используя исходные множество диагностируемых состояний и набор наблюдаемых характеристик, сформировать априорный словарь признаков и построить обучающую выборку, а затем на основе анализа данных этой выборки сформировать такое пространство решений, в котором формальные образы эталонов диагностируемых состояний разделены и компактны. У статті розглядається метод побудови комп’ютерної системи діагностики на основі алгоритмів розпізнавання образів і кластерного аналізу. Пропонується, використовуючи вхідний набір станів, що діагностуються, і набір спостережуваних характеристик, сформувати апріорний словник ознак і побудувати навчальну вибірку, а потім, на основі аналізу даних цієї вибірки, сформувати такий простір рішень, в якому формальні образи еталонів станів, що діагностуються, розподілені й компактні. In the article, the construction method of the computer diagnostics systems based on algorithms of pattern recognition and cluster analysis is considered. It is proposed, using the original set of diagnostic conditions and the one of observable characteristics, to form a priori features vocabulary and to build a training sample, and then on the basis of the analysis of the sample data to form such kind of solution space, in which the formal images of the standards of diagnosed conditions are separated and compact. ru Інститут проблем штучного інтелекту МОН України та НАН України Штучний інтелект Интеллектуальные системы планирования, управления, моделирования и принятия решений Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки Метод побудови комп’ютерної системи діагностики на основі аналізу даних вибірки, що навчає The Construction Method of the Computer Diagnostics Systems Based on the Analysis of Training Sample Data Article published earlier |
| spellingShingle | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки Родченко, В.Г. Олизарович, Е.В. Жукевич, А.И. Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| title | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| title_alt | Метод побудови комп’ютерної системи діагностики на основі аналізу даних вибірки, що навчає The Construction Method of the Computer Diagnostics Systems Based on the Analysis of Training Sample Data |
| title_full | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| title_fullStr | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| title_full_unstemmed | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| title_short | Метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| title_sort | метод построения компьютерной системы диагностики на основе анализа данных обучающей выборки |
| topic | Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| topic_facet | Интеллектуальные системы планирования, управления, моделирования и принятия решений |
| url | https://nasplib.isofts.kiev.ua/handle/123456789/57748 |
| work_keys_str_mv | AT rodčenkovg metodpostroeniâkompʹûternoisistemydiagnostikinaosnoveanalizadannyhobučaûŝeivyborki AT olizarovičev metodpostroeniâkompʹûternoisistemydiagnostikinaosnoveanalizadannyhobučaûŝeivyborki AT žukevičai metodpostroeniâkompʹûternoisistemydiagnostikinaosnoveanalizadannyhobučaûŝeivyborki AT rodčenkovg metodpobudovikompûternoísistemidíagnostikinaosnovíanalízudanihvibírkiŝonavčaê AT olizarovičev metodpobudovikompûternoísistemidíagnostikinaosnovíanalízudanihvibírkiŝonavčaê AT žukevičai metodpobudovikompûternoísistemidíagnostikinaosnovíanalízudanihvibírkiŝonavčaê AT rodčenkovg theconstructionmethodofthecomputerdiagnosticssystemsbasedontheanalysisoftrainingsampledata AT olizarovičev theconstructionmethodofthecomputerdiagnosticssystemsbasedontheanalysisoftrainingsampledata AT žukevičai theconstructionmethodofthecomputerdiagnosticssystemsbasedontheanalysisoftrainingsampledata |