Методы оценивания структуры знаний и онтологий Банка медицинских знаний

Качество и сложность реализации интеллектуальной программной системы, решающей задачу медицинской
 диагностики, зависит от структуры медицинских знаний, то есть от используемой онтологии. Метод
 оценивания структурных свойств таких составляющих онтологии, как онтология знаний и онтол...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2008
1. Verfasser: Шалфеева, Е.А.
Format: Artikel
Sprache:Russisch
Veröffentlicht: Інститут проблем штучного інтелекту МОН України та НАН України 2008
Schlagworte:
Online Zugang:https://nasplib.isofts.kiev.ua/handle/123456789/7385
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Методы оценивания структуры знаний и онтологий Банка медицинских знаний / Е.А. Шалфеева // Штучний інтелект. — 2008. — № 4. — С. 178-187. — Бібліогр.: 8 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
_version_ 1860246461610983424
author Шалфеева, Е.А.
author_facet Шалфеева, Е.А.
citation_txt Методы оценивания структуры знаний и онтологий Банка медицинских знаний / Е.А. Шалфеева // Штучний інтелект. — 2008. — № 4. — С. 178-187. — Бібліогр.: 8 назв. — рос.
collection DSpace DC
description Качество и сложность реализации интеллектуальной программной системы, решающей задачу медицинской
 диагностики, зависит от структуры медицинских знаний, то есть от используемой онтологии. Метод
 оценивания структурных свойств таких составляющих онтологии, как онтология знаний и онтология
 действительности, позволяет на ранних этапах разработки Банка медицинских знаний сделать важные
 оценки, связанные с качеством и сложностью его реализации. Метод позволяет выявлять неполноту модели
 предметной области, несогласованность определений терминов, предвидеть объем и сложность реализации
 редактора знаний о наблюдениях, редактора знаний о заболеваниях, оценить трудоемкость реализации
 решателя задачи диагностики и проведения испытаний Банка медицинских знаний. Якість і складність реалізації інтелектуальної програмної системи, вирішує завдання медичної діагностики,
 залежить від структури медичних знань, тобто від використовуваної онтології. Метод оцінювання
 структурних властивостей таких складових онтології, як онтологія знань і онтологія дійсності дозволяє на
 ранніх етапах розробки Банку медичних знань зробити важливі оцінки, пов’язані з якістю і складністю його
 реалізації. Метод дозволяє виявляти неповноту моделі предметної області, неузгодженість визначень
 термінів, передбачати об’єм і складність реалізації редактора знань про спостереження, редактора знань про
 захворювання, оцінити трудомісткість реалізації вирішувача завдання діагностики і проведення випробувань
 Банку медичних знань. Quality and complexity of realization of intelligence system for medicine diagnostics depend on medicine
 knowledge’s structure i.e. on used ontology. The method of evaluation of ontology structure allows early in
 the Medicine Bank development to make significant evaluations concerned with quality and complexity of its
 realization. The method allows to reveal incompleteness of domain model, the disagreement between the
 concept definitions, to predict size of realization of knowledge editors, to get the information that helps to
 simplify user’s interface, to estimate labor-intensiveness of diagnostics system programming and testing.
first_indexed 2025-12-07T18:36:48Z
format Article
fulltext «Искусственный интеллект» 4’2008 178 2Ш УДК 004.8 Е.А. Шалфеева Институт автоматики и процессов управления ДВО РАН, г. Владивосток, Россия shalf@iacp.dvo.ru Методы оценивания структуры знаний и онтологий Банка медицинских знаний* Качество и сложность реализации интеллектуальной программной системы, решающей задачу медицинской диагностики, зависит от структуры медицинских знаний, то есть от используемой онтологии. Метод оценивания структурных свойств таких составляющих онтологии, как онтология знаний и онтология действительности, позволяет на ранних этапах разработки Банка медицинских знаний сделать важные оценки, связанные с качеством и сложностью его реализации. Метод позволяет выявлять неполноту модели предметной области, несогласованность определений терминов, предвидеть объем и сложность реализации редактора знаний о наблюдениях, редактора знаний о заболеваниях, оценить трудоемкость реализации решателя задачи диагностики и проведения испытаний Банка медицинских знаний. Важнейшим классом задач, которые ставились перед искусственным интеллектом, являются системы, основанные на знаниях, т.е. интеллектуальные программы, основанные на использовании отдельно хранимой, пополняемой базы знаний о предметной области, и играющие «роль эксперта», умеющего решать некоторый круг задач, в частности, задач диагностики. Как правило, архитектура таких систем предусматривает редактор знаний, основанный на �h�g�l�h�e�h�]�b�b, которая описывает терминологию �a�g�Z�g�b�c требуемой предметной области. Этот редактор ориентирован на пользователя-эксперта. Другим пользователем интеллектуальной системы обычно является тот, кто намерен многократно использовать ее для получения решений на основе различных исходных данных. Используемая для диалога с этим пользователем терминология (для описания ситуаций в предметной области) может рассматриваться отдельно и представляться в так называемой �h�g�l�h�e�h�]�b�b�� �^�_�c�k�l�\�b�l�_�e�v�g�h�k�l�b�� Нередко тексты �h�g�l�h�e�h�]�b�b�� �a�g�Z�g�b�c и �h�g�l�h�e�h�]�b�b�� �^�_�c�k�l�\�b�l�_�e�v�g�h�k�l�b��размещены в разных теориях (или модулях) онтологии предметной области. Например, для решения задачи медицинской диагностики используются: �h�g�l�h�e�h�]�b�y���^�_�c�k�l�\�b�l�_�e�v�g�h�k�l�b��(или�� �h�g�l�h�e�h�]�b�y�� �^�Z�g�g�u�o), «онтология истории болезни» (в банке медицинских знаний) с такими терминами, как �^�g�_�\�g�b�d���h�k�f�h�l�j�Z�����j�_�a�m�e�v�l�Z�l���g�Z�[�e�x�^�_�g�b�y�����i�j�_�^�\�Z�j�b�l�_�e�v�g�u�c�� �^�b�Z�]�g�h�a���� �\�u�i�b�k�g�h�c�� �w�i�b�d�j�b�a���� �`�Z�e�h�[�u�� �i�j�b�� �i�h�k�l�m�i�e�_�g�b�b���� �n�Z�d�l�� �b�k�l�h�j�b�b�� �g�Z�k�l�h�y�s�_�]�h�� �a�Z�[�h�e�_�\�Z�g�b�y��и т.д., и �h�g�l�h�e�h�]�b�y�� �a�g�Z�g�b�c о медицинской диагностике с терминами: �g�h�j�f�Z�e�v�g�Z�y�� �j�_�Z�d�p�b�y���� �d�e�b�g�b�q�_�k�d�h�_�� �i�j�h�y�\�e�_�g�b�_���� �j�_�Z�d�p�b�y�� �g�Z�� �\�h�a�^�_�c�k�l�\�b�_�� �k�h�[�u�l�b�y���� �]�e�Z�\�g�u�_���`�Z�e�h�[�u�����g�Z�j�m�`�g�u�c���h�k�f�h�l�j и т.д. [1], [2]. По аналогии с тем, как технология разработки программного обеспечения предписывает проведение экспертиз моделей и документов, создаваемых командой разработчиков на всех этапах жизненного цикла, так и обеспечение качества * Работа выполнена при финансовой поддержке РФФИ, проект «Исследование возможностей коллективного управления в семантическом вебе информационными ресурсами различных уровней общности», и ДВО РАН, проект «Проектирование, разработка и развитие Банка медицинских знаний в сети Интернет». �F�_�l�h� �̂u���h�p�_�g�b�\�Z�g�b�y���k�l�j�m�d�l�m�j�u���a�g�Z�g�b�c���b���h�g�l�h�e�h�]�b�c���;�Z�g�d�Z���f�_� �̂b�p�b�g�k�d�b�o���a�g�Z�g�b�c�� «Штучний інтелект» 4’2008 179 2Ш создаваемой интеллектуальной системы должно производиться на ранних этапах ее создания. Ранними этапами могут считаться анализ предметной области, специфицирование требований и проектирование «верхнего уровня» системы. Возможные пути обеспечения качества интеллектуальной системы на этих этапах – оценивание используемых моделей знаний и онтологий, лежащих в их основе. Методом, обеспечивающим широкий спектр измеряемых свойств, является единый подход [3] к оцениванию структурных свойств онтологий и моделей знаний. Цель работы: установить связи структурных свойств онтологии со свойствами модели знаний, редактора знаний, пользовательского интерфейса и с трудоемкостью их разработки. В работе сначала приводится метод оценивания структуры онтологий и знаний, основанный на графовых моделях, затем поочередно представляется влияние структур- ных свойств онтологий на разные аспекты разработки банка медицинских знаний, такие как: характеристики модели знаний и процесса ее создания, возможность проверки полноты и корректности знаний, сложность реализации подсистемы диагностики. Методы оценивания онтологий и знаний по графам структуры стандартных связей В рамках единого подхода к оцениванию структурных свойств для произвольной онтологии предложены разные �]�j�Z�n�h�\�u�_�� �f�h�^�_�e�b, отражающие различные структурные свойства онтологии. Свойства структуры онтологии определяются в терминах соответствующих графов через подсчет числа вершин или дуг, числа одноименных дуг, разветвлений, числа и доли дуг с определенными метками и т.д. Среди групп графов, моделирующих структуру онтологий в рамках единого подхода, есть �]�j�m�i�i�Z�� �]�j�Z�n�h�\�� �k�b�g�l�Z�d�k�b�q�_�k�d�b�o���k�\�y�a�_�c и �]�j�m�i�i�Z���]�j�Z�n�h�\���k�l�Z�g�^�Z�j�l�g�u�o���k�\�y�a�_�c��[3]. Наиболее информативные свойства с точки зрения оценивания знаний и онтологий Банка медицинских знаний [4], [5] определятся по следующим графам: �]�j�Z�n���a�Z�\�b�k�b�f�h�k�l�b�� �l�_�j�f�b�g�h�\��(из группы �]�j�Z�n�h�\���k�b�g�l�Z�d�k�b�q�_�k�d�b�o���k�\�y�a�_�c) и���]�j�Z�n���k�l�Z�g�^�Z�j�l�g�h�c���i�Z�j�l�h�g�h�f�b�b�� (из группы �]�j�Z�n�h�\�� �k�l�Z�g�^�Z�j�l�g�u�o�� �k�\�y�a�_�c). Для �]�j�Z�n�h�\�� �k�l�Z�g�^�Z�j�l�g�u�o�� �k�\�y�a�_�c��характерно, что их вершины соответствуют терминам онтологии (их имена становятся метками вершин), а направленные дуги – стандартным видам связей (типично употребляемым при формализации онтологий). Названия связей составляют конечное множество уточня- ющих «подвидов» стандартных связей (они могут рассматриваться как метки для дуг) [3]. �=�j�Z�n�� �k�l�Z�g� �̂Z�j�l�g�h�c�� �i�Z�j�l�h�g�h�f�b�b�� �h�g�l�h�e�h�]�b�b – графовая модель <В, Д>, где вершины В = {в-i}, в-i – составные и простые сущности (в том числе строковые константы) онтологии, а дуги��Д = {д-j}����д-j���±��связи сущностей следующих видов: «�k�h�k�l�h�b�l�� �b�a�ª��(разнотипных терминов)�� ���y�\�e�y�_�l�k�y�� �©�i�Z�j�h�c�ª���� �©�l�j�h�c�d�h�c�ª��������,�� �\�d�e�x�q�Z�_�l�� �q�Z�k�l�v, �y�\�e�y�_�l�k�y�� �i�h�k�e�_�^�h�\�Z�l�_�e�v�g�h�k�l�v�x��(термин определен как�� �i�h�k�e�_�^�h�\�Z�l�_�e�v�� �g�h�k�l�v��(однотипных) �l�_�j�f�b�g�h�\����длина последовательности��задана или неопределена), �\�d�e�x�q�Z�_�l�� �i�h�^�i�h�k�e�_�^�h�\�Z�l�_�e�v�g�h�k�l�v,�� �y�\�e�y�_�l�k�y�� �f�g�h�`�_�k�l�\�h�f��(термин определен как�� �d�h�g�_�q�g�h�_�?�[�_�k�d�h�g�_�q�g�h�_�� �f�g�h�`�_�k�l�\�h�� �l�_�j�f�b�g�h�\), �\�d�e�x�q�Z�_�l�� �i�h�^�f�g�h�`�_�k�l�\�h���� �i�j�_�^�k�l�Z�\�e�_�g�h�� �Z�e�v�l�_�j�g�Z�l�b�\�g�u�f�� �i�h�g�y�l�b�_�f. Дополнительно партономическая связь (оба ее конца) характеризуется кардинальностью (1 или *) и модальностью (0 или 1) [6]. Пример определения свойства по этому графу (в каталоге свойств): �=�e�m�[�b�g�Z���i�Z�j�l�h�g�h�f�b�b���±��максимальная���^�e�b�g�Z���p�_�i�h�q�d�b���^�m�]��от���d�h�j�g�_�\�h�c��вершины к�� �e�b�k�l�h�\�h�c. Область значений: целое неотрицательное число. Возможное практическое применение: характеризует сложность моделируемой области знаний. Шалфеева Е.А. «Искусственный интеллект» 4’2008 180 2Ш Влияние свойств онтологии на характеристики модели знаний и процесса ее создания Сложность редактирования знаний зависит от их объема и сложности их структуры. Для онтологий многоцелевого банка наиболее показательные свойства измеряются по графу �i�Z�j�l�h�g�h�f�b�b��[6]�� Одна из эффективных метрик – �]�e�m�[�b�g�Z�� �b�_�j�Z�j�o�b�b���l�_�j�f�b�g�h�\. Значения �]�e�m�[�b�g�u�� �i�Z�j�l�h�g�h�f�b�b, превышающие 10, обычно означают, что ожидается относительно высокая трудоемкость редактирования знаний и проверки таких знаний. При вводе значений терминов переход от одного термина к другому включает в себя последовательность шагов «подъема» до некоторого термина- предка в иерархии и последовательность шагов «спуска». Пример – �]�e�m�[�b�g�Z�� �i�Z�j�l�h�g�h�f�b�b�� � �� ������для �h�g�l�h�e�h�]�b�b�� �a�Z�[�h�e�_�\�Z�g�b�c в медицинской диагностике [3], [5], [7].��Это означает, что��для каждого компонента диагностических знаний (здесь – для каждого заболевания) для указания требуемых значений признаков может понадобиться до 16 шагов перехода от термина к термину. При формировании «базы заболеваний в области офтальмологии» (в соответствующем редакторе) «путь» от названия заболевания к заданию значений нетривиальных признаков довольно длинный, хотя наиболее распространенное значение глубины (партономии) в этой базе знаний равно девяти [3], [5], [7]. Связывание нужного���g�Z�[�e�x�^�_�g�b�y��с его���o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z�f�b и их �a�g�Z�q�_�g�b�y�f�b,��которые лежат «глубоко», отражается на скорости редактирования знаний. Сложность редактирования знаний зависит от �q�b�k�e�Z�� �\�_�j�r�b�g���� �q�b�k�e�Z�� �^�m�]���� �q�b�k�e�Z�� �e�b�k�l�h�\��(в рассматриваемой модели)����Чем больше эти значения, тем больше затраты на редактирование и проверку, а в последнем случае – тем больше компонентов знаний (в примере: для каждого заболевания) должны быть описаны при редактировании. Рисунок 1 – Граф партономии онтологии наблюдений для офтальмологии �F�_�l�h� �̂u���h�p�_�g�b�\�Z�g�b�y���k�l�j�m�d�l�m�j�u���a�g�Z�g�b�c���b���h�g�l�h�e�h�]�b�c���;�Z�g�d�Z���f�_� �̂b�p�b�g�k�d�b�o���a�g�Z�g�b�c�� «Штучний інтелект» 4’2008 181 2Ш Большие значения ширины иерархии понятий�� (измеряемой здесь как�� �r�b�j�b�g�Z�� �i�Z�j�l�h�g�h�f�b�b)��свидетельствуют о проработанности предметной области, о ее тщательной структурированности, о потенциальной возможности адекватно представить знания. С другой стороны, они свидетельствуют о сложности знаний (сложнее разобраться, дольше проверять, тщательнее тестировать). �R�b�j�b�g�Z���i�Z�j�l�h�g�h�f�b�b���[�_�a���m�q�_�l�Z���^�m�]���Z�e�v�l�_�j�g�Z�l�b�\ характеризует минимум ширины партономии знаний, которые могут быть созданы в рамках рассматриваемой онтологии. �I�h�e�m�k�l�_�i�_�g�v�� �b�k�o�h�^�Z�� �^�e�y�� �^�m�]���d�h�f�i�h�g�_�g�l�h�\��характеризует число компонентов знаний, которые должны быть описаны при редактировании. А чем больше���i�h�e�m�k�l�_�i�_�g�v�� �b�k�o�h�^�Z��� �̂e�y���^�m�]���Z�e�v�l�_�j�g�Z�l�b�\, тем чаще пользователю предоставлен выбор типов данных (или значений) при редактировании знаний. �Q�b�k�e�h���p�b�d�e�h�\ характеризует «потенциал» для увеличения глубины партономии знаний. Если нет циклов, то глубина партономии базы знаний соответствует глубине партономии онтологии. В другом случае использование цикличной связи терминов приводит к углублению партономических связей в модели знаний. Пример. В �[�Z�g�d�_�� �f�_�^�b�p�b�g�k�d�b�o�� �a�g�Z�g�b�c многоцелевого банка знаний [4], [5] хранится �h�g�l�h�e�h�]�b�y�� �g�Z�[�e�x�^�_�g�b�c (всего 19 терминов), в ее партономическом графе есть два цикла (рис. 1). За счет циклов между этими терминами определяемая и редактируемая в этих терминах «база наблюдений в области офтальмологии» гораздо сложнее, она имеет большую глубину партономического дерева (рис. 2). Рисунок 2 – Пример последовательности шагов редактирования знаний для офтальмологии Конкретные наблюдения представлены «глубокой» партономической структурой (за счет использования циклических путей для терминов «группа», «составные значения»). Корневой термин «база наблюдений» представлен тремя терминами- группами: �k�h�[�u�l�b�y�����m�k�e�h�\�b�y���b���]�j�m�i�i�Z���g�Z�[�e�x�^�_�g�b�c. Одна из �]�j�m�i�i состоит из 7 �l�_�j�f�b�g�h�\�� �g�Z�[�e�x�^�_�g�b�c (каждому соответствует от 2 до 11 несовместных значений), другая «раскладывается на 4 �l�_�j�f�b�g�Z���]�j�m�i�i�u, которые состоят из нескольких терминов- наблюдений и т.д. Такие характеристики онтологии проявляются и при использовании в одних теориях фрагментов знаний из других теорий. �=�e�m�[�b�g�Z���i�Z�j�l�h�g�h�f�b�b��знаний о наблюдении�� составляет��12, и это означает, что��для использования �a�g�Z�g�b�c�� �h�� �g�Z�[�e�x�^�_�g�b�b в �a�g�Z�g�b�y�o�� �h�� �a�Z�[�h�e�_�\�Z�g�b�y�o (или при описании �b�k�l�h�j�b�b���[�h�e�_�a�g�b) могут потребоваться дополнительные от 2 до 12 шагов «спуска» по терминам используемой теории (т.к. термин-наблюдение «подставляется вместо» �e�b�k�l�h�\�h�c��вершины в �[�Z�a�_�� �a�Z�[�h�e�_�\�Z�g�b�c (в истории болезни). Сложность их редактирования поэтому зависит от глубины знаний в используемой теории. Кроме того, глубина термина в дереве отражается на скорости поиска или перебора (связана с числом шагов перехода от термина к его характеристикам). Шалфеева Е.А. «Искусственный интеллект» 4’2008 182 2Ш При реализации редакторов знаний и редакторов данных для банка медицинских знаний есть необходимость контроля следующей информации: соответствуют ли вводимые �o�Z�j�Z�d�l�_�j�b�k�l�b�d�b и �a�g�Z�q�_�g�b�y характеристик тем �o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z�f и допускаемым �a�g�Z�q�_�g�b�y�f характеристик, которые предусмотрены в �[�Z�a�_�� �g�Z�[�e�x�^�_�g�b�c���� Например, важно своевременно обнаруживать, не введены ли пользователем в качестве жалоб новые виды �g�Z�[�e�x�^�_�g�b�c����если они не совпадают с описанными в �[�Z�a�_���g�Z�[�e�x�^�_�g�b�c, то для них нет информации в �a�g�Z�g�b�y�o���h���a�Z�[�h�e�_�\�Z�g�b�b). Свойствами, обеспечивающими полезной информацией, являются: �g�Z�e�b�q�b�_�� �\�� �h�g�l�h�e�h�]�b�q�_�k�d�b�o�� �k�h�]�e�Z�r�_�g�b�y�o (онтологии знаний и онтологии действительности) ограничений на значения (указанных) терминов (например, �\�o�h� �̂g�h�]�h�� � �̂Z�g�g�h�]�h и зафиксированного в знаниях термина). При реализации редактора следует предусмотреть соответствующую проверку значений. Другое свойство – �g�Z�e�b�q�b�_���l�_�j�f�b�g�h�\�����^�b�Z�i�Z�a�h�g���a�g�Z�q�_�g�b�c���d�h�l�h�j�u�o��перечисляемое�� �f�g�h�`�_�k�l�\�h����В терминов графа партономии измеряется с помощью вышеупомянутой полустепени исхода для дуг-альтернатив. Для ввода каждого из таких входных данных надо реализовать выбор из списка допустимых значений. Влияние свойств онтологии на возможность проверки полноты и корректности знаний экспертом Иерархичность знаний и показатели размера иерархии отражают возможность полноценной проверки введенных знаний. Эффективными свойствами �i�Z�j�l�h�g�h�f�b�q�_�k�d�h�c структуры, позволяющими эксперту убеждаться в полноте и корректности онтологии, лежащей в основе знаний, являются: �R�b�j�b�g�Z���i�Z�j�l�h�g�h�f�b�b,�� �>�e�b�g�Z���i�m�l�b���d���d�h�j�g�_�\�h�c���\�_�j�r�b�g�_��(от вершины – рассматриваемой сущности), �>�e�b�g�Z���i�m�l�b���d���e�b�k�l�h�\�h�c���\�_�j�r�b�g�_��(от вершины – рассматриваемой сущности). Пример. В базе наблюдений �r�b�j�b�g�Z�� �i�Z�j�l�h�g�h�f�b�b��(на верхнем уровне)���[�h�e�v�r�Z�y���� соответствует �q�b�k�e�m�� �h�i�b�k�Z�g�g�u�o�� �\�b�^�h�\�� �g�Z�[�e�x�^�_�g�b�c����Это свидетельствует о возможной полноте и достаточности знаний для формирования целевых знаний (например, знаний о заболеваниях на базе заболеваний), но и о продолжительности перехода\поиска нужного компонента используемых знаний. �R�b�j�b�g�Z���i�Z�j�l�h�g�h�f�b�b��(для каждого поддерева) также большая. Это свидетельствует о затратах на переход\поиск нужного компонента используемых знаний, о соответствующих затратах на проверку введенных знаний, но и о потенциальной достаточности знаний. По�� �]�j�Z�n�m�� �i�Z�j�l�h�g�h�f�b�b возможно �\�u�y�\�e�_�g�b�_�� �©�g�_�h�^�g�h�a�g�Z�q�g�h�k�l�b�� �b�f�_�g�ª как наличие вершин с одинаковыми именами, но имеющие разные части-«потомки». Значение такого свойства чрезвычайно важно, поскольку неоднозначные названия терминов усложняют поиск ошибок и анализ полноты и правильности Для каждого вводимого пользователем�� набора экземпляров сущностей, наборов значений их атрибутов��или связей между разными экземплярами разных или однотипных сущностей��важно наличие своевременной проверки соответствия таких значений, если они явно существуют и описаны в соглашениях онтологии. Это становится особенно критичным, если выявлены �g�_�h�i�j�_�^�_�e�y�_�f�u�_�� �l�_�j�f�b�g�u.�� Определение свойства �q�b�k�e�h�?�f�g�h�`�_�k�l�\�h�� �g�_�h�i�j�_�^�_�e�y�_�f�u�o�� �l�_�j�f�b�g�h�\ типично осуществляется по �]�j�Z�n�m�� �a�Z�\�b�k�b�f�h�k�l�b�� �l�_�j�f�b�g�h�\,�� альтернативным вариантом является рассмотрение �q�b�k�e�Z�?�f�g�h�`�_�k�l�\�Z���e�b�k�l�h�\���i�Z�j�l�h�g�h�f�b�b (и выбор тех, которые являются терминами-объектами с неопределенной структурой).���� �F�_�l�h� �̂u���h�p�_�g�b�\�Z�g�b�y���k�l�j�m�d�l�m�j�u���a�g�Z�g�b�c���b���h�g�l�h�e�h�]�b�c���;�Z�g�d�Z���f�_� �̂b�p�b�g�k�d�b�o���a�g�Z�g�b�c�� «Штучний інтелект» 4’2008 183 2Ш Так, на практике, при обеспечении качества редакторов знаний и данных системы, решающей задачу диагностики заболеваний (в области офтальмологии), было обнаружено, что в онтологии действительности для связей �g�Z�[�e�x�^�_�g�b�_�����o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z���� �d�Z�q�_�k�l�\�_�g�g�h�_�� �a�g�Z�q�_�g�b�_�� �j�_�a�m�e�v�l�Z�l�Z�� �g�Z�[�e�x�^�_�g�b�y��представлены без описания диапазонов возможных значений [5]. Поэтому при вводе\описании данных имя жалобы может быть указано в произвольной форме (наблюдавшиеся значения некоторого признака у пациента вносятся в теорию-историю болезни пациента через полномочие «редактирование базы историй болезни», при этом �a�g�Z�q�_�g�b�_�� �g�Z�[�e�x�^�Z�_�f�h�c�� �`�Z�e�h�[�u не выбирается из списка, а �\�i�_�q�Z�l�u�\�Z�_�l�k�y, значит допускается возможность ошибиться). И �g�Z�a�\�Z�g�b�_���g�Z�[�e�x�^�_�g�b�y может быть дано не из хранимого списка наблюдений. Также и выбор типа значений может быть сделан несоответствующий (например, вместо �d�Z�q�_�k�l�\�_�g�g�h�]�h может быть назначено �p�_�e�h�_ значение). Затраты на возможность и удобство деятельности эксперта, проверяющего полноту и корректность знаний, зависят также от свойств онтологии: �I�h�e�m�k�l�_�i�_�g�v���a�Z�o�h�^�Z�����k�j�_�^�g�y�y���b���f�Z�d�k�b�f�Z�e�v�g�Z�y��, �I�h�e�m�k�l�_�i�_�g�v���b�k�o�h�^�Z���^�e�y���^�m�]���d�h�f�i�h�g�_�g�l�h�\�����\���a�g�Z�g�b�y�o��, �� �Q�b�k�e�h���e�b�k�l�h�\���� П�h�e�m�k�l�_�i�_�g�v���a�Z�o�h�^�Z больше единицы при описании наблюдений означает наличие одинаковых характеристик для разных наблюдений. Проверяющему легче осуществлять проверку однотипных элементов. Чем больше �i�h�e�m�k�l�_�i�_�g�v���b�k�o�h�^�Z���^�e�y���^�m�]���d�h�f�i�h�g�_�g�l�h�\ и �q�b�k�e�h���e�b�k�l�h�\��– тем больший объем целевых знаний требует проверки. Пример: �f�Z�d�k�b�f�Z�e�v�g�h�_�� �a�g�Z�q�_�g�b�_���±�� ������(столько допустимых значений предусмо- трено для термина-наблюдения «конъюнктива верхнего века», термина-характеристики «изменения»): Рисунок 3 – Пример спектра значений для одного термина-наблюдения в офтальмологии Шалфеева Е.А. «Искусственный интеллект» 4’2008 184 2Ш Связь свойств модели знаний со сложностью реализации подсистемы диагностики Сложность реализации подсистемы диагностики для медицинского банка знаний связана с таким компонентом модели знаний, как «база заболеваний в области офтальмологии». Сложность реализации подсистемы определяется: �q�b�k�e�h�f�� �^�b�Z�]�g�h�a�h�\ (т.к. нужен перебор по всем различным заболеваниям), �k�e�h�`�g�h�k�l�v�x���[�Z�a�u�� �a�g�Z�g�b�c (т.к. для каждого заболевания происходит построение всех возможных вариантов развития причинно-следственных связей). Здесь �q�b�k�e�h�� �^�b�Z�]�g�h�a�h�\��– число вершин, связанных дугой «элемент множества» с вершиной, названной, например, «заболевания» (или «знания о заболеваниях»). Учитываемые свойства �i�Z�j�l�h�g�h�f�b�q�_�k�d�h�c���k�l�j�m�d�l�m�j�u этой �f�h�^�_�e�b���a�g�Z�g�b�c таковы: �=�e�m�[�b�g�Z���i�Z�j�l�h�g�h�f�b�b,�� �R�b�j�b�g�Z���i�Z�j�l�h�g�h�f�b�b��на верхнем уровне, �R�b�j�b�g�Z���i�Z�j�l�h�g�h�f�b�b��(каждого поддерева��в базе знаний),�� �Q�b�k�e�h���\�_�j�r�b�g�����Q�b�k�e�h���^�m�]�����I�h�e�m�k�l�_�i�_�g�v���a�Z�o�h�^�Z,�� �I�h�e�m�k�l�_�i�_�g�v���b�k�o�h�^�Z���^�e�y���^�m�]���d�h�f�i�h�g�_�g�l�h�\,�� �Q�b�k�e�h���e�b�k�l�h�\.�� Они отражаются на сложности реализации подсистемы диагностики (и скорости «перехода от» диагностируемого заболевания к значениям его характеристик, чтобы сопоставить их значениям, наблюдаемым у пациента). Типичная глубина партоно- мического дерева – 9 дуг. �R�b�j�b�g�Z�� �i�Z�j�l�h�g�h�f�b�b�� �g�Z��третьем уровне – 19 (соответствует числу заболеваний, рассматривается в знаниях). От таких характеристик структуры знаний зависит не только реализация подсистемы диагностики, но и проводимые испытания подсистемы. Одна из подзадач �^�b�Z�]�g�h�k�l�b�d�b��(в области офтальмологии) – проверка гипотезы о том, что все наблюдавшиеся значения некоторого признака могут иметь место у пациента при некотором заболевании. Эта гипотеза считается подтверждённой, если для каждого наблюдаемого значения признака найдена его причина. Задача медицинской диагностики является обратной задачей: зная результаты обследования пациента и начало заболевания (если пациент не здоров), требуется найти его диагноз. Естественным методом решения такой задачи является перебор всех возможных значений выходных данных (отдельных заболеваний). Для каждого заболевания выполняется решение прямой задачи – построение всех возможных вариантов развития причинно- следственных связей (на основе информации из базы знаний: значений анатомо- физиологических особенностей пациента и произошедших с ним событий) и поиск среди них такого, которому соответствуют все наблюдаемые значения признаков пациента [7]. Наличие непроверенных фрагментов знаний (являющееся следствием наличия �g�_�^�h�h�i�j�_�^�_�e�_�g�g�u�o�� �l�_�j�f�b�g�h�\ в онтологии и отсутствия для таких терминов онтологических соглашений) является существенным риском для правильности принимаемых системой решений (выводимых диагнозов). Если наблюдавшиеся значения некоторого признака у пациента внесены с ошибкой, то алгоритм не даст корректного сравнения условия «для конкретного наблюдавшегося �i�j�b�a�g�Z�d�Z выполнения необходимого �m�k�e�h�\�b�y�ª�� �F�_�l�h� �̂u���h�p�_�g�b�\�Z�g�b�y���k�l�j�m�d�l�m�j�u���a�g�Z�g�b�c���b���h�g�l�h�e�h�]�b�c���;�Z�g�d�Z���f�_� �̂b�p�b�g�k�d�b�o���a�g�Z�g�b�c�� «Штучний інтелект» 4’2008 185 2Ш Влияние связей между базами знаний и онтологиями на сложность реализации подсистемы диагностики Для решения задачи диагностики используются: два модуля\теории, описывающих знания: �a�g�Z�g�b�y���h диагностике и �a�g�Z�g�b�y���h���g�Z�[�e�x�^�_�g�b�y�o�����d�Z�`�^�Z�y���b�a���g�b�o���i�h�k�l�j�h�_�g�Z���i�h���k�\�h�_�c�� �h�g�l�h�e�h�]�b�b��. Используются �^�Z�g�g�u�_ (архив с жалобами пациентов), построенные по �h�g�l�h�e�h�]�b�b���^�Z�g�g�u�o – «онтологии истории болезни». Имеет место следующая связь между ними: �a�g�Z�g�b�y�� �h диагностике (построенные в терминах �h�g�l�h�e�h�]�b�b���a�g�Z�g�b�c о диагностике) еще используют термины из �a�g�Z�g�b�c���h���g�Z�[�e�x�^�_�g�b�y�o. И �^�Z�g�g�u�_��тоже��используют термины из �a�g�Z�g�b�c���h���g�Z�[�e�x�^�_�g�b�y�o. �H�g�l�h�e�h�]�b�y�� �g�Z�[�e�x�^�_�g�b�c �A�g�Z�g�b�y���h�� �g�Z�[�e�x�^�_�g�b�y�o �A�g�Z�g�b�y���h�� �a�Z�[�h�e�_�\�Z�g�b�y�o �H�g�l�h�e�h�]�b�y�� �a�Z�[�h�e�_�\�Z�g�b�c �H�g�l�h�e�h�]�b�y�� �b�k�l�h�j�b�b�� �[�h�e�_�a�g�b�� �B�k�l�h�j�b�y�� �[�h�e�_�a�g�b�����Z�j�o�b�\�� Рисунок 4 – Граф связи теорий медицинского банка знаний Сложность �k�\�y�a�b�� �[�Z�a�u�� �a�g�Z�g�b�c�� �k�� �h�g�l�h�e�h�]�b�_�c�� �^�_�c�k�l�\�b�l�_�e�v�g�h�k�l�b проявляется в том, что согласно [7] при решении задачи диагностики осуществляется поиск среди вариантов развития заболевания (т.е. в базе знаний) такого варианта, которому соответствуют наблюдаемые значения признаков пациента. В архиве (т.е. в базе исходных данных) значения признаков «лежат на 8-м уровне», в базе заболеваний значение, с которым надо сравнивать, «лежит на 14-м уровне» (в соответствующих онтологиях – на 8-м и на 11-м). Свойства �f�Z�d�k�b�f�Z�e�v�g�Z�y�� �]�e�m�[�b�g�Z�� �e�b�k�l�Z�� �\�� �i�Z�j�l�h�g�h�f�b�b и �k�j�_�^�g�y�y�� �]�e�m�[�b�g�Z позволяют сделать предварительный вывод о требуемом числе переходов от рассматриваемого термина-корня к нужному значению-листу. Сложность реализации подсистемы определяется: �k�e�h�`�g�h�k�l�v�x�� �h�i�b�k�Z�g�b�y�� �b�k�l�h�j�b�b�� �[�h�e�_�a�g�b (особенностей пациента и значений произошедших с ним событий), сложностью �a�g�Z�g�b�c�� �h�� �g�Z�[�e�x�^�_�g�b�y�o (в описаниях клинических проявлений наблюдаемых признаков\жалоб их «область значений следствия» должна соответствовать описанным в базе наблюдений), сложностью �k�\�y�a�b�� �[�Z�a�u�� �a�g�Z�g�b�c�� �k�� �h�g�l�h�e�h�]�b�_�c�� �^�Z�g�g�u�o (поскольку производится поиск такого «варианта развития», которому соответствуют наблюдаемые значения «признаков» пациента). Шалфеева Е.А. «Искусственный интеллект» 4’2008 186 2Ш Чем сложнее �a�g�Z�g�b�y�� �h�� �g�Z�[�e�x�^�_�g�b�y�o���� �l�_�f�� �^�e�b�g�g�_�_�� �i�m�l�v�� �d�� �g�Z�[�e�x�^�_�g�b�x�� �k�� �_�]�h�� �o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z�f�b и их �a�g�Z�q�_�g�b�y�f�b��при описании жалоб больного, и тем сложнее реализовать вышеуказанные проверки в решателе либо редакторе данных о пациенте. Пример. В МБКЗ искомое �g�Z�[�e�x�^�_�g�b�_ находится на 3-м уровне; нужная ему �o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z���k�h �a�g�Z�q�_�g�b�y�f�b��находится на 5-м уровне; это отражается на скорости редактирования, на скорости проверки. Кроме того «длинные» «подключаемые» «веточки» из базы наблюдений в данные о жалобах пациента и в знания о заболеваниях увеличивают глубину структуры, хранящей данные и знания, что отражается на скорости поиска или перебора при постановке диагноза (переходы от термина к его характеристикам). В «базе заболеваний офтальмологии» при описании «главных жалоб» конкретных «заболеваний» инженер знаний «использует» подветочку «вариант клинические проявления» из «онтологии базы заболеваний», при этом конкретизируя все ее листы (для всех 19 заболеваний). А при описании «лабораторных исследований» конкретных «заболеваний» «использует» подветочку «мазок из конъюнктивы…» и ее подветочку от вершины «качественные значения» из «базы наблюдений» (плюс еще две подветочки для видов лабораторных исследований). Таким образом, сцепление этих трех теорий довольно высокое. Поскольку в банках МБКЗ при вводе\описании данных, соответствующих листовым нетерминальным вершинам, значение может быть указано в произвольной форме, то есть могут быть проигнорированы ранее введенные и проверенные з�g�Z�g�b�y�� �h���g�Z�[�e�x�^�_�g�b�y�o (в архиве истории болезней название наблюдения может быть дано не из хранимого списка наблюдений, или выбор типа значений может быть сделан несоответствующий, например, вместо «качественного» может быть назначено «целое» значение), то при реализации есть необходимость проверить: 1) не введены ли пользователем «новые» виды �g�Z�[�e�x�^�_�g�b�c��(в качестве жалоб), т.е. неправильные названия для них); 2) соответствуют ли вводимые �o�Z�j�Z�d�l�_�j�b�k�l�b�d�b и �a�g�Z�q�_�g�b�y характеристик тем (�o�Z�j�Z�d�l�_�j�b�k�l�b�d�Z�f и допускаемым �a�g�Z�q�_�g�b�y�f характеристик), которые преду- смотрены в базе. Таким образом, при реализации задач диагностики приходится учитывать не только структуру модуля знаний о диагностике, но и число используемых в нем других модулей знаний или онтологий и структурные свойства каждого из них. Заключение В результате проведенного исследования предложены графы структуры стандартных связей онтологии и подмножество соответствующих структурных свойств, существенных для обеспечения качества медицинского банка знаний. Выявлены те структурные свойства, которые эффективны при обнаружении показателей сложности реализации редакторов и решателей, показателей дополнительных затрат на обеспечение контроля вводимой информации, в частности, для тех случаев, в которых достоверность знаний в модели знаний сильно зависит от внимательности и других качеств эксперта, а адекватность принимаемых системой решений – от внимательности пользователя, формирующего исходные данные. Таким образом, установлена зависимость некоторых внешних свойств онтологии (свойств, проявля- ющихся при использовании банка экспертом и при решении задач диагностики) от ее внутренних (структурных) свойств. �F�_�l�h� �̂u���h�p�_�g�b�\�Z�g�b�y���k�l�j�m�d�l�m�j�u���a�g�Z�g�b�c���b���h�g�l�h�e�h�]�b�c���;�Z�g�d�Z���f�_� �̂b�p�b�g�k�d�b�o���a�g�Z�g�b�c�� «Штучний інтелект» 4’2008 187 2Ш Наличие точных определений свойств в терминах графовых моделей и метода построения графовых моделей для онтологий многоцелевого банка знаний позволяет применять такой подход для различных специализированных банков. Оценивание структурных свойств онтологий на основе единого подхода является наиболее «экономически целесообразным» подходом к анализу онтологий, поскольку на ранних стадиях разработки дает объективные показатели. Если утверждена используемая онтология знаний, то анализ ее свойств является источником для деятельности по обеспечению качества разрабатываемой интеллектуальной системы, а также является источником информации для планирования затрат на разработку. Кроме того, измерение используемых онтологий предметных областей дает возможность улучшить их до того, как на их основе будут построены редакторы знаний. Литература 1.�� Клещёв А.С., Москаленко Ф.М., Черняховская М.Ю. Модель онтологии предметной области «медицинская диагностика». Часть 2. Формальное описание причинно-следственных связей, причин значений признаков и причин заболеваний // НТИ. Сер. 2. – 2006. – № 2. – С. 19-30. 2.�� Черняховская М.Ю., Негода В.И., Москаленко Ф.М. Формальное представление знаний о конъюнктивитах. – Владивосток: ИАПУ ДВО РАН, 2008. – 55 с. 3.�� Клещев А.С., Шалфеева Е.А. Определение структурных свойств онтологий // Изв. РАН. Теория и системы управления. – 2008. – № 2. – С. 69-78. 4.�� Клещев А.С., Орлов В.А. Компьютерные банки знаний. Многоцелевой банк знаний // Информационные технологии. – 2006. – № 2. – С. 2-8. 5.�� Список банков знаний Многоцелевого банка знаний. – Режим доступа: http://mpkbank2.dvo.ru/ mpkbank/index.php?page=banks. 6.�� Каталог структурных свойств онтологий. Свойства структуры стандартных связей // Владивосток: ИАПУ ДВО РАН. – 2007. – С. 38. 7.�� Москаленко Ф.М. Задача медицинской диагностики и алгоритм её решения, допускающий распараллеливание // ИСУ. – Благовещенск����2005. – Режим доступа: article3-moskalenko- iacp(vladivostok).rtf 8.�� Каталог структурных свойств онтологий. Свойства синтаксической структуры. – Владивосток: ИАПУ ДВО РАН. – 2007. – С. 28. Є.А. Шалфеєва Методи оцінювання структури знань і онтологий Банку медичних знань Якість і складність реалізації інтелектуальної програмної системи, вирішує завдання медичної діагностики, залежить від структури медичних знань, тобто від використовуваної онтології. Метод оцінювання структурних властивостей таких складових онтології, як онтологія знань і онтологія дійсності дозволяє на ранніх етапах розробки Банку медичних знань зробити важливі оцінки, пов’язані з якістю і складністю його реалізації. Метод дозволяє виявляти неповноту моделі предметної області, неузгодженість визначень термінів, передбачати об’єм і складність реалізації редактора знань про спостереження, редактора знань про захворювання, оцінити трудомісткість реалізації вирішувача завдання діагностики і проведення випробувань Банку медичних знань. E.A. Shalfeyeva Evaluation Methods of Knowledge’s and Ontology’s Structure for «Medicine Bank» Quality and complexity of realization of intelligence system for medicine diagnostics depend on medicine knowledge’s structure i.e. on used ontology. The method of evaluation of ontology structure allows early in the Medicine Bank development to make significant evaluations concerned with quality and complexity of its realization. The method allows to reveal incompleteness of domain model, the disagreement between the concept definitions, to predict size of realization of knowledge editors, to get the information that helps to simplify user’s interface, to estimate labor-intensiveness of diagnostics system programming and testing. �K�l�Z�l�v�y���i�h�k�l�m�i�b�e�Z���\���j�_�^�Z�d�p�b�x������������������������
id nasplib_isofts_kiev_ua-123456789-7385
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
issn 1561-5359
language Russian
last_indexed 2025-12-07T18:36:48Z
publishDate 2008
publisher Інститут проблем штучного інтелекту МОН України та НАН України
record_format dspace
spelling Шалфеева, Е.А.
2010-03-29T13:19:58Z
2010-03-29T13:19:58Z
2008
Методы оценивания структуры знаний и онтологий Банка медицинских знаний / Е.А. Шалфеева // Штучний інтелект. — 2008. — № 4. — С. 178-187. — Бібліогр.: 8 назв. — рос.
1561-5359
https://nasplib.isofts.kiev.ua/handle/123456789/7385
004.8
Качество и сложность реализации интеллектуальной программной системы, решающей задачу медицинской&#xd; диагностики, зависит от структуры медицинских знаний, то есть от используемой онтологии. Метод&#xd; оценивания структурных свойств таких составляющих онтологии, как онтология знаний и онтология&#xd; действительности, позволяет на ранних этапах разработки Банка медицинских знаний сделать важные&#xd; оценки, связанные с качеством и сложностью его реализации. Метод позволяет выявлять неполноту модели&#xd; предметной области, несогласованность определений терминов, предвидеть объем и сложность реализации&#xd; редактора знаний о наблюдениях, редактора знаний о заболеваниях, оценить трудоемкость реализации&#xd; решателя задачи диагностики и проведения испытаний Банка медицинских знаний.
Якість і складність реалізації інтелектуальної програмної системи, вирішує завдання медичної діагностики,&#xd; залежить від структури медичних знань, тобто від використовуваної онтології. Метод оцінювання&#xd; структурних властивостей таких складових онтології, як онтологія знань і онтологія дійсності дозволяє на&#xd; ранніх етапах розробки Банку медичних знань зробити важливі оцінки, пов’язані з якістю і складністю його&#xd; реалізації. Метод дозволяє виявляти неповноту моделі предметної області, неузгодженість визначень&#xd; термінів, передбачати об’єм і складність реалізації редактора знань про спостереження, редактора знань про&#xd; захворювання, оцінити трудомісткість реалізації вирішувача завдання діагностики і проведення випробувань&#xd; Банку медичних знань.
Quality and complexity of realization of intelligence system for medicine diagnostics depend on medicine&#xd; knowledge’s structure i.e. on used ontology. The method of evaluation of ontology structure allows early in&#xd; the Medicine Bank development to make significant evaluations concerned with quality and complexity of its&#xd; realization. The method allows to reveal incompleteness of domain model, the disagreement between the&#xd; concept definitions, to predict size of realization of knowledge editors, to get the information that helps to&#xd; simplify user’s interface, to estimate labor-intensiveness of diagnostics system programming and testing.
ru
Інститут проблем штучного інтелекту МОН України та НАН України
Прикладные интеллектуальные системы
Методы оценивания структуры знаний и онтологий Банка медицинских знаний
Методи оцінювання структури знань і онтологий Банку медичних знань
Evaluation Methods of Knowledge’s and Ontology’s Structure for «Medicine Bank»
Article
published earlier
spellingShingle Методы оценивания структуры знаний и онтологий Банка медицинских знаний
Шалфеева, Е.А.
Прикладные интеллектуальные системы
title Методы оценивания структуры знаний и онтологий Банка медицинских знаний
title_alt Методи оцінювання структури знань і онтологий Банку медичних знань
Evaluation Methods of Knowledge’s and Ontology’s Structure for «Medicine Bank»
title_full Методы оценивания структуры знаний и онтологий Банка медицинских знаний
title_fullStr Методы оценивания структуры знаний и онтологий Банка медицинских знаний
title_full_unstemmed Методы оценивания структуры знаний и онтологий Банка медицинских знаний
title_short Методы оценивания структуры знаний и онтологий Банка медицинских знаний
title_sort методы оценивания структуры знаний и онтологий банка медицинских знаний
topic Прикладные интеллектуальные системы
topic_facet Прикладные интеллектуальные системы
url https://nasplib.isofts.kiev.ua/handle/123456789/7385
work_keys_str_mv AT šalfeevaea metodyocenivaniâstrukturyznaniiiontologiibankamedicinskihznanii
AT šalfeevaea metodiocínûvannâstrukturiznanʹíontologiibankumedičnihznanʹ
AT šalfeevaea evaluationmethodsofknowledgesandontologysstructureformedicinebank