Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы

Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Предложен алгоритм экспертного процесса, чередую...

Повний опис

Збережено в:
Бібліографічні деталі
Дата:2012
Автори: Ильина, Е.П., Слабоспицкая, О.А.
Формат: Стаття
Мова:Russian
Опубліковано: Інститут проблем математичних машин і систем НАН України 2012
Назва видання:Математичні машини і системи
Теми:
Онлайн доступ:http://dspace.nbuv.gov.ua/handle/123456789/60015
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы / Е.П. Ильина, О.А. Слабоспицкая // Мат. машини і системи. — 2012. — № 3. — С. 103-115. — Бібліогр.: 11 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-60015
record_format dspace
spelling irk-123456789-600152015-07-03T09:07:09Z Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы Ильина, Е.П. Слабоспицкая, О.А. Інформаційні і телекомунікаційні технології Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Предложен алгоритм экспертного процесса, чередующего реальные туры с виртуальными мультиагентными. Розроблено формальний апарат моделювання ефективності Дельфі-процесу оцінки скалярного параметра. Він ґрунтується на моделях мультиагентного частково спостережуваного марківського процесу прийняття рішень та сімейства онтологій експертних точок зору. Запропоновано алгоритм експертного процесу, що здійснює чергування реальних турів з віртуальними мультиагентними. The formal device for Delphi process efficiency modeling of scalar parameter estimation was developed. It is based on both Decentralized POMDP and expert viewpoints ontology models family. The algorithm for expert process alternating real tours and virtual multi-agent ones was proposed. 2012 Article Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы / Е.П. Ильина, О.А. Слабоспицкая // Мат. машини і системи. — 2012. — № 3. — С. 103-115. — Бібліогр.: 11 назв. — рос. 1028-9763 http://dspace.nbuv.gov.ua/handle/123456789/60015 519.711 ru Математичні машини і системи Інститут проблем математичних машин і систем НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Інформаційні і телекомунікаційні технології
Інформаційні і телекомунікаційні технології
spellingShingle Інформаційні і телекомунікаційні технології
Інформаційні і телекомунікаційні технології
Ильина, Е.П.
Слабоспицкая, О.А.
Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
Математичні машини і системи
description Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Предложен алгоритм экспертного процесса, чередующего реальные туры с виртуальными мультиагентными.
format Article
author Ильина, Е.П.
Слабоспицкая, О.А.
author_facet Ильина, Е.П.
Слабоспицкая, О.А.
author_sort Ильина, Е.П.
title Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
title_short Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
title_full Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
title_fullStr Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
title_full_unstemmed Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы
title_sort мультиагентная модель для управления эффективностью дельфи-процесса многотуровой экспертизы
publisher Інститут проблем математичних машин і систем НАН України
publishDate 2012
topic_facet Інформаційні і телекомунікаційні технології
url http://dspace.nbuv.gov.ua/handle/123456789/60015
citation_txt Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы / Е.П. Ильина, О.А. Слабоспицкая // Мат. машини і системи. — 2012. — № 3. — С. 103-115. — Бібліогр.: 11 назв. — рос.
series Математичні машини і системи
work_keys_str_mv AT ilʹinaep mulʹtiagentnaâmodelʹdlâupravleniâéffektivnostʹûdelʹfiprocessamnogoturovojékspertizy
AT slabospickaâoa mulʹtiagentnaâmodelʹdlâupravleniâéffektivnostʹûdelʹfiprocessamnogoturovojékspertizy
first_indexed 2025-07-05T11:08:19Z
last_indexed 2025-07-05T11:08:19Z
_version_ 1836804944991092736
fulltext © Ильина Е.П., Слабоспицкая О.А., 2012 103 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 УДК 519.711 Е.П. ИЛЬИНА, О.А. СЛАБОСПИЦКАЯ МУЛЬТИАГЕНТНАЯ МОДЕЛЬ ДЛЯ УПРАВЛЕНИЯ ЭФФЕКТИВНОСТЬЮ ДЕЛЬФИ-ПРОЦЕССА МНОГОТУРОВОЙ ЭКСПЕРТИЗЫ Анотація. Розроблено формальний апарат моделювання ефективності Дельфі-процесу оцінки скалярного параметра. Він ґрунтується на моделях мультиагентного частково спостережувано- го марківського процесу прийняття рішень та сімейства онтологій експертних точок зору. За- пропоновано алгоритм експертного процесу, що здійснює чергування реальних турів з віртуальни- ми мультиагентними. Ключові слова: мультиагентний частково спостережуваний марківський процес прийняття рі- шень, Дельфі-процес, спільна політика, бізнес-обумовлена точка зору, сімейство онтологій експе- ртних точок зору, функція когнітивної корисності, ефективність багатотурової експертизи. Аннотация. Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Пред- ложен алгоритм экспертного процесса, чередующего реальные туры с виртуальными мультиа- гентными. Ключевые слова: мультиагентный частично наблюдаемый марковский процесс принятия реше- ний, Дельфи-процесс, совместная политика, бизнес-обусловленная точка зрения, семейство онто- логий экспертных точек зрения, функция когнитивной полезности, эффективность многотуровой экспертизы. Abstract. The formal device for Delphi process efficiency modeling of scalar parameter estimation was developed. It is based on both Decentralized POMDP and expert viewpoints ontology models family. The algorithm for expert process alternating real tours and virtual multi-agent ones was proposed. Keywords: multy-agent partially observable markov decision process, Delphi-process, general policy, business-related viewpoint, ontologies family of expert viewpoints, cognitive utility function, effectiveness of multi-rounded expertize. 1. Введение. Постановка проблемы Современные процессы принятия сложных и ответственных решений по управлению ши- роко используют аппарат экспертной методологии [1]. Это обеспечивает непосредственное привлечение опыта специалистов в предметных областях, актуальных для объекта управ- ления, с целью отсеивания, приоритетного выбора и обоснования решений в условиях сла- бой формализованности, информационной неопределенности и различий профессиональ- ных и ведомственных взглядов на решаемую задачу. Использование экспертной методологии осуществляется в самых разнообразных формах. В аспекте постановки задачи экспертизы распространены и анкетирование по по- воду наличия у объекта заданных свойств и появлений, и ранжирование во множестве аль- тернатив [1, 2], и непосредственное оценивание как скалярного критерия, так и терми- нальных параметров в иерархической модели критерия предпочтений [1, 3]. В аспекте формы процедуры и природы итоговой оценки полярными являются индивидуальное оце- нивание с последующим обобщением и коллективное оценивание [1, 2]. Индивидуальное оценивание позволяет избежать давления на мнение экспертов. Однако в его стандартном варианте неясной остается стратегия дальнейших действий организатора экспертизы при неудовлетворительной согласованности индивидуальных оценок. Такой эффект может быть вызван совершенно разными причинами (различие информированности об объекте, разная смысловая интерпретация параметра его качества, предвзятое отношение к отдель- 104 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 ным альтернативам и т.д.). Для подавления подобных негативных влияний прибегают к специальным процедурам подбора экспертов, предоставлению информационного контек- ста оценивания в рамках постановки проблемы, использованию многокритериальных мо- делей (опосредованное оценивание качества), сопровождению оценок их структурирован- ным обоснованием. Одним из подходов, наиболее широко используемых с 60-х годов XX века, является метод Дельфи [5], балансирующий между индивидуальным оцениванием и коллективным. Все имеющиеся разновидности этого метода, которые различаются далеко не только технологически, но и в целевом, и в когнитивном плане [5], объединяет следую- щая схема. Реализуется многотуровая процедура. В ней после обобщения индивидуальных оценок, полученных в очередном туре, при условии недостигнутости априорно заданного уровня их согласованности, участникам предоставляется некоторая информация о резуль- татах тура. При этом открывается новый тур, дающий возможность изменить свои преж- ние оценки и во многих процедурах дать аргументацию своей позиции. Предоставляемая экспертам информация о проведенном туре рассматривается в модели Дельфи как содер- жание обратной связи между шагом обобщения и шагом индивидуального оценивания [5]. Во всех вариантах метода ее состав более узок, чем общедоступные данные при коллек- тивном оценивании. Как и следовало ожидать, при сохраняющемся действии неопределенного и неод- нородного поля причин рассогласованности оценок не удается оценить шансы на сходи- мость процесса и, тем более, ее скорость. То же можно сказать об априорном выборе со- держания обратных связей и рекомендуемом числе туров. В предположении решающего влияния бизнес-обусловленных концептуальных взглядов экспертов на объекты экспертизы шансы для решения обозначенной выше про- блемы управления эффективностью Дельфи-процесса предоставляет использование апри- орной информации о таких концепциях, соответствующих ведомственной и профессио- нальной принадлежности экспертов [6]. В данной работе исследуется подход к управлению эффективностью Дельфи- процесса, модель которого: – использует для аргументирования индивидуальных оценок указание элементов профессиональной деятельности экспертов, представленных в априорной онтологической модели корпоративной точки зрения [7]; – постулирует принципы рационального поведения в согласовательном процессе; – исходит из начального множества аргументированных индивидуальных оценок (результаты первого тура); – формирует виртуальные туры с участием искусственных агентов, репрезенти- рующих выявленные позиции реальных экспертов. Такой подход является актуальным для систем поддержки принятия экспертных решений, которое выполняется многократно (на этапах жизненного цикла экспертируемо- го объекта); касается взаимозависимых объектов; требует учета точек зрения, различаю- щихся, но принадлежащих фиксированному множеству. В [8] показано, что именно таким условиям соответствуют процессы стратегического управления организациями и отрасля- ми. В частности, соответствующие средства поддержки принятия экспертных решений не- обходимы в системах экспертно-аналитического сопровождения целевых программ [8]. Целью работы является построение модели Дельфи-процесса, обеспечивающей анализ перспектив его развертывания на основе аргументированных индивидуальных оце- нок в первом туре и априорной информации о точках зрения на предметную область, пред- ставители которых привлечены к экспертизе. В качестве базового математического аппарата исследования были взяты: ISSN 1028-9763. Математичні машини і системи, 2012, № 3 105 – модель мультиагентного частично наблюдаемого марковского процесса принятия решений (МЧНМПР); – парадигма онтологически базированных Дельфи-процессов (обозначаемых далее О-Дельфи) [7], развитием которой служит предлагаемый подход. 2. Используемые положения модели МЧНМПР Обобщение трактовок, предложенных специалистами для базовых понятий децен- трализованных марковских процессов принятия решений [9], позволяет сформулировать Определение 1. Мультиагентный частично наблюдаемый марковский процесс при- нятия решений (МЧНМПР) с конечным горизонтом – это девятиэлементный кортеж { } BTROPniASIPR ii ;;;;;,...,1);,(;; =Ω= , (1) где { }nI ,...,1= – конечное множество агентов, произвольным образом индексированных их номерами; S – конечное множество состояний мира; { }1,α ≥= jA iji – конечное множество действий ijα , доступных агенту i ; { }1,ω ≥=Ω kiki – конечное множество наблюдений состояния мира ikω , доступных агенту i ; iASvu vupP ⊗∈∈ ∗ ∗= α,, )α,|( – матричное представление марковской функции переходов между состояниями, где элемент )α,|( ∗vup обозначает условную вероятность перехода мира из состояния v в состояние u в результате выполнения всеми агентами в состоянии v совместного действия inin A...,,11 )α...,,α(α = ∗ ⊗∈= ; iiASu uoO Ω⊗∈⊗∈∈ ∗∗ ∗∗= ω,α, )α,|ω( – матрица, элементы )α,|ω( ∗∗ uo которой – условные вероятности совместного наблюдения inin Ω⊗∈= = ∗ ...,,11 )ω...,,ω(ω в состоянии мира Su∈ после выполнения всеми агентами совместного действия inin A...,,11 )α...,,α(α = ∗ ⊗∈= и пере- хода мира в состояние u ; );(: ...,,1 ∞−∞→⊗× = ini ASR – функция вознаграждения, значение )β,( ∗uR которой пред- ставляет собой объем вознаграждения, совместно получаемого всеми агентами за выпол- нение в состоянии мира Su∈ совместного действия inin A...,,11 )β...,,β(β = ∗ ⊗∈= ; ∞<T – временной горизонт; )),(( SuubB ∈= – начальное распределение вероятностей на множестве состояний мира, элемент )(ub которого обозначает вероятность, что на момент начала процесса мир нахо- дится в состоянии u . Применение приведенной модели МЧНМПР (1) для опосредованного управления мультиагентными процессами требует поиска локальных политик для каждого агента, ко- торые совместно максимизируют их ожидаемое общее вознаграждение на протяжении пе- риода T при условии, что начальным распределением вероятностей на множестве состоя- ний мира является 0B . Модель МЧНМПР (1) определяет [9] представление локальной политики агента { }nIi ,...,1=∈ в виде дерева (ориентированного ациклического графа). Вершинами этого графа являются действия агента ( iij A∈α , см. определение 1), а ребрами – его наблюдения ( iik Ω∈ω ), которые, с определенными вероятностями, могут иметь место после выполне- ния соответствующих действий. 106 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 Листьями дерева локальной политики являются действия, потенциально возможные на последнем, T-м шаге процесса после соответствующей предыстории действий и наблю- дений на протяжении T-1 шагов. Придерживаясь некоторой политики при выполнении МЧНМПР, агент на первом шаге выполняет действие, являющееся корнем соответствующего ей дерева, а дальше на каждом шаге процесса итеративно выбирает вложенную политику, представленную под- деревом, связанным с текущей вершиной-действием ребром, которое представляет дейст- вительное наблюдение агента после выполнения этого действия. Описанную сущность по- литики формализует рекурсивное Определение 2 [10]. Случайная локальная подполитика агента i -го уровня t (на шаге t ) МЧНМПР – это пара t i t i t i t i Qq ∈= )η,ψ( , (2) где t iQ – множество деревьев, являющихся представлениями допустимых подполитик уровня t ; ]1;0[:ψ →× t i t i QA – функция выбора действий, определяющая условные вероятности р(ai |qi t) на множестве действий в зависимости от подполитики, выбранной на шаге t ; ]1;0[: 1 →Ω××− i t i t i t i QQη – функция перехода, определяющая условные вероятности (обо- значим их ))ω,|( 1 i t i t i qqp − выбора подполитик ( )1−t -го шага (т.е. 1−t iq ) при условии, что на шаге t будет выбираться подполитика t iq и иметь место наблюдение . ω ii Ω∈ В данной работе для мультиагентной поддержки моделирования процесса О- Дельфи выбран оптимизационный подход [10] к пошаговому построению совместной по- литики агентов МЧНМПР с использованием определения 2. Сущность этого подхода фик- сирует Определение 3. Оптимизационная задача построения общей подполитики уровня Tt ,...,1= состоит в определении кортежа отображений ,δ,...,δδ 1 * n= таких, что ,,...,1,:δ;,...,)δ(ω),...,ω(δ)ω(δ 111 ** niQqq t iii t n t n =→Ω== (3) которые максимизируют функцию ценности формируемой политики уровня )1( +t )),ω(δ(),α|,ω(),α(),α( *** ω, ***)1( 8 ssVbssPrbRbV t ss t ∑+=+ (4) для заданного распределения вероятностей на множестве состояний мира Bb∈ , совмест- ного действия ini A...,,1α = ∗ ⊗∈ , множеств подполитик t n tt QQQ ...,,1=∗ и функции ценности уровня t : ∑ ∑==→⊗ s s tt sRsbbRsbssspssobssPrRSQV ).α,()(),α();()α,|()α,|ω(),α|,ω(;: ******** 3. Предметная область процесса О-Дельфи и принципы его моделирования Целью организации и применения многотурового процесса поэтапного сближения инди- видуальных экспертных оценок является повышение эффективности экспертного оценива- ния в условиях неоднородной информированности и заинтересованности экспертов отно- сительно различных свойств, связей и проявлений экспертируемых объектов и процессов. Основу парадигмы О-Дельфи составляет тезис о существенном вкладе в такую не- однородность различных бизнес-обусловленных точек зрения, представленных эксперта- ми. Используя априорные знания о точках зрения, можно получить возможность создания искусственных агентов для их репрезентации. Это позволяет формировать виртуальные ISSN 1028-9763. Математичні машини і системи, 2012, № 3 107 туры Дельфи-процесса, строя и исследуя соответствующие модели класса МЧНМПР (1)- (4). Виртуальные туры могут как предшествовать реальным турам при участии экспертов, так и следовать за ними. Реальными участниками процесса являются постановщики проблемы и эксперты, входящие в состав экспертной группы, модель которой определяет множество учитывае- мых точек зрения. Виртуальные участники – это искусственные агенты. Каждый из них руководству- ется в своих действиях знаниями о предметной области экспертизы, онтологически специ- фицированными для репрезентируемой им точки зрения, в составе используемых структур априорного знания. Этап Дельфи-процесса является действием каждого из участников, включающим обязательные элементы: – предоставление индивидуальной оценки скалярного целевого параметра X, харак- теризующего объект экспертизы; – предоставление онтологически обусловленной аргументации оценки. Кроме того, для большинства туров процесса к числу формируемых участниками элементов принадлежат также: – оценка силы собственной предоставленной аргументации; – оценка силы чужой аргументации, предоставленной другим экспертом вместе с его индивидуальной оценкой целевого параметра на предыдущем туре. Рассмотрим базовые характеристики О-Дельфи в связи с предложенным в [7, 11] формализмом семейства онтологий экспертных точек зрения (СОЭТ), элементы которого используются как априорные структуры знаний об актуальных концептуальных взглядах на предметную область и об отношениях между концептами. Обозначим: O – концепт, соответствующий классу экспертируемого объекта O; )(OX – целевой параметр с искомым значением XK и его оценками iX , предос- тавленными участниками i ; P – постановка экспертной задачи, включающая, помимо O и )(OX , множество },{YYY= к которому принадлежат концепты из контекста решения проблемы, представ- ленные своими объектами Y . Положим: ,)2(/)(/)()1(,,, DDMLHMLHiDMDDDDXDDXK ii ∈−+−×−==∈∈ где DD – множество дискретов, iD – центр i -го интервала. Такая дискретизация значений параметра X с областью определения [ ],; HL с од- ной стороны, предоставляет возможность работать с дискретной моделью МЧНМПР, а с другой, является естественной формализацией качественной шкалы, в которой отобража- ются M градаций X , где M определено как параметр знаний о концепте O . Пусть для концепта O задано такое множество }{),,( raCXORA = отношений между Oи концептами C из состава СОЭТ, что каждое из отношений: – определяет потенциальную возможность C служить аргументацией XK ; – основывается в предикате, осуществляющем такое определение, только на си- стеме частичных определений O и C в СОЭТ и на отношениях между концептами [11]. Определим множества концептов )},,(|{),( CXOraCXOPA = – потенциальную ар- гументацию ).,( jXO Кроме того, положим существование предиката Pr , определяющего 108 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 сужение множества потенциальной аргументации до множества аргументации, актуальной в условиях определенной постановки задачи: )),,(},|{},({ XOPAAPCPCPXPr ∈ где P – постановка экспертной проблемы; )),,(},|{},({ XOPAAPCPCPXPr ∈ ),(),( XOPAXOPAA ⊆ – множество актуальной аргу- ментации. Отметим, что предикат Pr может входить в число элементов частичного определе- ния концепта соответствующей проблемы в СОЭТ, а может быть установлен посредством анализа предыстории решения проблем этого класса в ретроспективе экспертиз [8]. Предложенные определения предоставляют возможность автоматического форми- рования множества аргументов в виртуальных турах Дельфи-процесса, а также пересмотра множества аргументов в следующем виртуальном туре, вслед за сменой iX . Относительно оценки силы для iX элемента аргументации A, выдвинутого i -м агентом – субъектом оценки, в качестве ее меры может использоваться значение метрики отношения информативности ),,( AOINF вычисленное в онтологии, соответствующей агенту точки зрения, как предложено в [11]. Оценка силы чужой аргументации, принадлежащей онтологии j -й точки зрения, может быть выполнена агентом i -й точки зрения с применением аппарата функции когни- тивной полезности, предложенного в [7]. При этом онтологический концепт C, используе- мый агентом j как аргумент, получает свое определение в онтологии j посредством вы- полнения операции погружения [11] его ближайшей семантической окрестности. Функция полезности результата операции для онтологии j аккумулирует вклады позитивных эф- фектов (прояснение недоопределенности знаний о концептах, усвоение новых концептов) и конкурирующих с ними негативных (противоречия с имеющимися в j знаниями, непо- нимаемость определений C в терминах концептов j ). Количественный учет этих эффек- тов осуществляется использованием метрик соответствующих отношений, разработанных в аппарате СОЭТ [11]. Отдельный аспект парадигмы О-Дельфи, моделируемого с помощью аппарата МЧНМПР (1)–(4), составляют принципы рационального поведения экспертов. В данной работе к ним отнесены: а) желание сохранить свои взгляды (минимальность уступки); б) конструктивная реакция на убедительную аргументацию; в) готовность к уступке ради компромисса. В целом соответствия между основными концептами Дельфи-процесса и модели МЧНМПР приведены в табл. 1. Таблица 1. Взаимоотношение концептов модели Дельфи-процесса и МЧНМПР № Концепт Дельфи-процесса Концепт МЧНМПР 1 Цель (получение эффективно согласован- ных оценок) Функция вознаграждения (зависящая от аргумен- тированности оценок и расстояний между ними) 2 Эксперт Агент 3 Оценка, полученная в невиртуальном пер- вом туре Начальное состояние мира 4 Рациональность поведения (соблюдение собственных убеждений) Матрица вероятностей переходов (зависящая от скачка собственной оценки ) 5 Индивидуальное экспертное мнение в по- вторном туре (аргументированная оценка целевого параметра и аргументации Действие ISSN 1028-9763. Математичні машини і системи, 2012, № 3 109 Продолж. табл. 1 чужих мнений предыдущего тура) 6 Содержание обратных связей (оценки и аргу- ментация предыдущего тура) Наблюдения, доступные агенту в текущем состоянии мира 7 Предельное количество туров Установленный временной горизонт 8 Шкала оценивания целевого параметра Возможные состояния мира 9 Сценарий поведения искусственных агентов, представляющих точки зрения из состава моде- ли экспертной группы Политика Рассмотрим собственно формализацию Дельфи-процесса с помощью модели МЧНМПР. Для применения модели МЧНМПР процесс О-Дельфи рассматривается в следую- щем варианте постановки задачи. Многотуровый процесс принятия решений используется для установления такого значения некоторой скалярной характеристики [ ] HLHLXK ≤≤∈ 0,; на заданном числовом промежутке [ ],; HL которое осуществляет компромисс индивидуальных мнений привлеченных экспертов. Дополнительно допуска- ется независимость наблюдений экспертов. Вводится также параметр риска О-Дельфи [ ].1;0σ∈ Предусматриваются две формы туров О-Дельфи: – реальный тур, на протяжении которого каждый эксперт k предоставляет свои оценки kd для XK и оценки ));,(,(* kdkarke – виртуальный тур, смысл которого заключается в поиске совместной политики всех экспертов на основании предоставленных ими оценок и априорного знания относи- тельно предметной области, а также оценки характеристик последующего хода процесса при реализации такой политики. Пусть определены три вспомогательных функции: ),(:),( XOPASDIDdkar k →⊗ – аргументирования экспертом k дискрета kd , выбранного им при действии kα ; [ ]AXOPAIdiarke D i ;0),(:)),(,( →⊗ – оценивания экспертом k аргументации, предоставленной другим экспертом ku≠ для выбранного им дискрета id в рамках его действия uα на предыдущем шаге О-Дельфи, при выполнении экспертом k действия kα ; [ ]AXOPAIdkarke D k ;0),(:)),(,(* →⊗ – оценивания экспертом k аргументации, предоставленной им самим для выбран- ного дискрета на текущем шаге Дельфи-процесса при выполнении действия kα , где A – максимально возможное значение оценки аргументации. Формальное представление содержательных определений элементов модели МЧНМПР (1), предложенных для описания Дельфи-процесса в табл. 1, фиксирует Определение 4. Представление Дельфи-процесса как МЧНМПР с конечным гори- зонтом – это девятиэлементный кортеж ,;;,;;;;; DDDDDDDDD BTROPASIDP Ω= (5) где { }nI D ,...,1= – множество экспертов, привлеченных к Дельфи-процессу; 110 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 DS – множество дискретов априорно определенного размера MLH /)( − ; [ ]{ },...,,1,/)(;/))(1(, MlMLHlLMLHlLffS ll D =−+−−+== (6) средние точки которых рассматриваются в роли оценок искомого значения [ ];; HLXK∈ H и L – верхняя и нижняя границы числового интервала, где разворачивается Дельфи- процесс; M – параметр точности искомого результата Дельфи-процесса; { }kAD α= – множество индивидуальных действий произвольного эксперта k : );,(),(;;),,(,α XOPAdkarSdEdkard k D kkkkk ∈∈= ;),(,(...,)),,(,()),,1(,(...,)),,2(,()),,1(,( 121 nkkk dnarkedkarkedkarkedarkedarkeE ∗ −−= (7) kd – дискрет, выбранный экспертом k при выполнении им действия kα ; { }k D ω=Ω – множество индивидуальных наблюдений, доступных для произвольного эксперта k ( T – отметка транспонирования строки); ;;;ω kkkk EEARD= );...,,,...,,,( 1121 nkkk dddddD +−= ;)...,,,...,,,( T 1121 nkkk EEEEEEE +−= (8) ;),(...,)),,()),,(...,)),,2(),,1( 1121 nkkk dnardkardkardardarAR +−= ;)α,|( α,, DnD ASvu DD vupP ⊗∈∈ ∗ ∗=     ≤− >− = ∑ ≤− ∗ σαα σ σ ||),),|((/),|( ||,0 )α,|( || **** vuvupvup vu vup vu D ; (9) { } ;/)α(|αα||)α,|( nufvuvup kk =∈×−= ∗∗∗ ;)α...,,α,α(α 21 Dn n A⊗∈=∗ kk DD dfSAf =→ )α(,: – функция, сопоставляющая индивидуальному действию экс- перта )k(α выбранный им дискрет ( kd ); ;)α,|ω( α,,ω DnDDn ASu DD voO ⊗∈∈Ω⊗∈ ∗∗ ∗∗= );α,|ω()α,|ω( ...,,1 ∗ = ∗∗ ∏= upuo nk k D (10) ; иначе0 ))(),...,(),(...,),((.ωпри,1 )α,|ω( 111    − = = +−∗ nkkkk k ffffD up αααα kk D.ω – вектор наблюдаемых дискретов, выбранных агентами О-Дельфи ki ≠ на пре- дыдущем шаге Дельфи-процесса, в составе наблюдения ;ωk [ ]50;50: −→⊗× DnD ASR – функция вознаграждения специального вида [ ],))(/)).β(())β(())β(µ((2/1100)β,( LHEfufuR kkkk −××−−×=∗ ννν (11) kk E.β – вектор оценок аргументации (6), которые будут предоставлены во время вы- полнения действия kβ ; )µ(• – медиана выборки, а )(•ν – выборочный квартильный коэффициент вариации [8], то есть отношение медианы к удвоенной разности третьего и первого квартилей; DT – количество шагов процесса О-Дельфи; )),(( DDD SuubB ∈= – вектор вероятностей события, что в начале процесса оценкой XK является ,DSu∈ которые имеют вид ISSN 1028-9763. Математичні машини і системи, 2012, № 3 111 ; иначе0 )),(,(/))),(,((при,1 )( ,...,1 * ,...,1 *     − = = ∑∑ == nk knk kkD dkarkedkarkedu ub D k Sd ∈ – дискрет, выбранный экспертом k во время выполнения его действия kα . Предложенная модель представления процесса О-Дельфи как МЧНМПР и алгорит- мы ее использования включают три параметра управления: точность ( M ), продолжитель- ность, или горизонт )( DT , рискованность (σ ), значения которых при моделировании должны задаваться априорно. Точность )(M определяет шкалу дискретов и связана с количеством качественных градаций, целесообразным для селевого параметра. Как правило, спектр таких градаций легко выявляется посредством предварительного интервьюирования специалистов ПрО. Продолжительность связана с количеством туров процесса О-Дельфи, которое является приемлемым для организаторов по критерию «качество/цена». Рискованность (σ ) введена для отображения готовности к риску, ожидаемой от участников процесса. Можно реко- мендовать начинать моделирование, принимая ,/σ 1 Mu= где 1u – состояние мира, достиг- нутое в реальном туре (соответствует осторожной стратегии). 4. Использование МЧНМПР для повышения эффективности многотуровых экспер- тиз, организуемых с привлечением априорных знаний Предложенная в данной работе формализация О-Дельфи предоставляет последующее раз- витие результатов [7], осуществляемое для частного случая задачи экспертизы (оценка скалярного критерия). Такая возможность возникает за счет экспериментирования с моде- лью развития Дельфи-процесса, который стартует с реальных начальных условий и проте- кает согласно принципам, воспроизводящим концептуальное соотношение реально при- влеченных точек зрения, ожидаемое на основании априорной информации относительно ПрО принятия решений. В пределах заложенных предположений экспериментирование позволяет получить: – прогноз эффективности последующих k туров; – консультацию относительно ожидаемых возражений и непониманий в последую- щих турах для участников, частично продемонстрировавших свою позицию; – оценку эффективности построения многотурового процесса на основе другой, альтернативной парадигмы. На рис. 1 приведена схема динамического управления процессом О-Дельфи, кото- рая включает: – основные действия, выполняемые при динамическом управлении Дельфи- процессом в соответствии с рассматриваемым подходом (обозначенные ромбами); – концептуальные и ретроспективные знания относительно ПрО экспертизы (парал- лелепипеды); – постановку задачи на разных стадиях ее интерпретации и актуализации (прямо- угольники с двойным контуром); – промежуточные структуры знаний, продуцируемые и используемые выполняе- мыми действиями (закругленные прямоугольники). Целью организуемого процесса является получение такой оценки целевого пара- метра экспертируемого объекта, которая обеспечивает наиболее полное и непротиворечи- вое воспроизведение точек зрения на этот объект, имеющих место в ПрО. На схеме видно, какие трансформации претерпевает постановка задачи экспертизы. Из постановки, иден- тифицирующей потребности внешнего субъекта, она, прежде всего, трансформируется в 112 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 вопрос, поставленный в терминах и в контексте объектного и субъектного измерения про- блемной ситуации в ПрО. Это происходит посредством: – онтологизации элементов постановки (интерпретации базовых элементов концеп- тами СОЭТ и извлечения релевантных знаний из структур априорного знания о ПрО); – концептуальной идентификации экспертной группы (выявления состава точек зрения, носителями которых являются эксперты). Полученная постановка адресована участникам реального тура процесса оценива- ния. Рис. 1. Организация Дельфи-процесса с использованием МЧНМПР Если такой тур не является первым, дополнением к нему служит содержание обрат- ных связей, позволяющих реализовать функцию консультирования для экспертов. Наконец, наиболее удаленной от изначально заданной является постановка для мо- делирования виртуального тура. Она формируется на основе интерпретации исходных структур модели МЧНМПР, описанных выше, при аналитическом рассмотрении результа- тов действия “Выполнение реального тура”. Означивание ряда элементов постановки, представляющих собой параметры управ- ления, остается неформальной процедурой, хотя и производится на основе формально по- лученных характеристик. Так, увеличение горизонта DT с последующим увеличением рискованности σ по- тенцируется низкой согласованностью индивидуальных оценок в нескольких реальных ту- рах подряд при выявлении тех же тенденций в сопутствующих виртуальных турах, а уменьшение параметра рискованности σ целесообразно, когда результаты реального тура, хотя и неудовлетворительные, оказываются лучше, чем результаты виртуального. ISSN 1028-9763. Математичні машини і системи, 2012, № 3 113 Среди действий, включенных в схему, можно выделить: – средства адаптации к имеющимся знаниям относительно ПрО и опыту работы в ней («Онтологизация постановки экспертной задачи» и «Концептуальная идентификация экспертной группы»); – средства поддержки реального и виртуального туров; – средства аналитической поддержки выбора последующего сценария и формиро- вания контекста его реализации («Аналитическая обработка результатов тура», «Формиро- вание обратных связей»). Аналитическая обработка результатов тура формирует, по результатам реального тура, результаты интеграции экспертных мнений и оценок качества такой интеграции, рас- смотренные в предыдущих исследованиях по онтологически базированным экспертизам [11]. Кроме того, формируются версия аргументационного поля, скорректированная экс- пертами, и перекрестные оценки предоставленной аргументации, вычисленные формально с помощью средств использования априорных знаний [7]. К свойствам оценок добавляется характеристика полезности тура t tU : )),((/)( ...,,1 LHnACEXKXU itni titt −×××−= ∑ = (12) где itX – оценка i -го эксперта в туре t ; tXK – результирующая оценка для тура t ; itCE – средняя, для всех вычисленных, оценка аргументированности itX ; H и L – границы области изменения X ; n – количество экспертов; A – максимально возможная оценка аргументации. Выводы, которые формируются после этого аналитического действия, касаются вы- бора дальнейших действий. Действие «Моделирование виртуального тура» продуцирует компромиссные оцен- ки и их аргументацию вместе с историей их достижения (потурово), а также оценки полез- ности: ФU для финального тура, для которого она вычисляется как вознаграждение (11), и для процесса в целом: ,1ФПР UUU −= где 1U оценивается по формуле (12). Действие «Формирование обратных связей» определяет множества: – конфликтных агентов, к которым принадлежат те, чьи действия создают самые низкие вклады в вознаграждение; – конфликтных аспектов элементов аргументации, которые обусловливают наибо- лее существенную долю обнаруженных противоречий; – свойств получаемого в виртуальном туре гипотетического компромисса, вклю- чающих интегральную оценку его аргументированности, а также оценки полезности: ПРU , ФU и коэффициент ./)(κ ...,,1Ф ∑ = = si iUsU Управление процессом О-Дельфи в рамках предложенной схемы начинается с про- ведения реального первого тура экспертизы. Если выводы после аналитической обработки его результатов свидетельствуют об их неудовлетворительности или неубедительности, осуществляется обращение к моделированию виртуального тура. Последнее может быть многократным с различными значениями горизонта моделирования. Целью является фор- мирование решения о целесообразности многотуровой процедуры, которое относится к выводам при выполнении действия «Формирование обратных связей». Частный случай составляет ситуация, когда свойства решения начального реального тура свидетельствовали о возможности разбиения экспертной группы на две партии, пред- ставляющие полярные взгляды на объект экспертизы [5, 7]. В этом случае моделирование 114 ISSN 1028-9763. Математичні машини і системи, 2012, № 3 виртуальных туров осуществляется отдельно для каждой из сформированных партий, а вывод о реальном осуществлении следующих туров делается только тогда, когда удовле- творительный прогноз получен для каждой из партий. При продолжении процесса О-Дельфи (с одной или двумя экспертными группами) каждому реальному туру предшествует проведение виртуального, который поставляет участникам реальных туров консультативную информацию, повышающую шансы на эф- фективную коррекцию ими оценок и их аргументации. Очевидно, что необходимыми ус- ловиями достижения позитивного эффекта использования рассмотренного алгоритма яв- ляются: – актуальное состояние априорных знаний о ПрО; – соответствие состава экспертной группы ее модели; – достаточно широкое варьирование значений параметров управления при модели- ровании виртуальных туров. 5. Выводы 1. Предложенное формальное представление многотурового Дельфи-процесса как муль- тиагентного частично наблюдаемого марковского процесса принятия решений открывает возможность для управления его эффективностью. 2. Онтологическая базированность моделируемого Дельфи-процесса обеспечивает форми- рование политики, направленной не только на сближение оценок, но и на повышение убе- дительности их аргументации. 3. Разработанный алгоритм последовательного использования реальных и виртуальных туров Дельфи-процесса позволяет принимать решения по поводу: – целесообразности применения многотуровой процедуры; – выбора ее эффективной формы (с одной экспертной группой либо парой полярно ориентированных групп); – содержания обратных связей для реальных туров; – перспективного количества осуществляемых туров. СПИСОК ЛИТЕРАТУРЫ 1. Тоценко В.Г. Методы и системы поддержки принятия решений. Алгоритмический аспект. – К., Наукова думка, 2002. – 381 с. 2. Крымский С.Б. и др. Экспертные оценки в социологических исследованиях. – К.: Наукова думка, 1990. – 320 с. 3. Von Winterfeldt D. Decision Analysis and Behavioral Research / D. von Winterfeldt, W. Edwards. – Cambridge: Cambridge University Press, International edition, 1986. – 604 p. 4. Научно-техническое прогнозирование для промышленности и правительственных учреждений / Пер. с англ.; под ред. Г.М. Доброва. – М.: Прогресс, 1972. – 185 с. 5. Turoff M. The Delphi Method: Techniques and Applications [Електронний ресурс] / М. Turoff, Н. Linstone. – Addison-Wesley, 2002. – 608 р. – Режим доступу: http://www.is.njit.edu/ pubs/delphibook. 6. Ильина Е.П. Задачи и методы аналитического сопровождения экспертиз в партисипативных процессах стратегического управления / Ильина Е.П. // Проблемы программирования. – 2006. – № 2–3. – C. 421 – 430. 7. Ильина Е.П. Функции и методы поддержки современных парадигм метода Дельфи / Е.П. Ильина // Проблемы программирования. – 2009. – № 1. – С. 36 – 52. 8. Ильина Е.П. Автоматизированная поддержка принятия решений по управлению программами фундаментальных научных исследований с использованием экспертной методологии / Ильина Е.П., Слабоспицкая О.А., Синицын И.П., Яблокова Т.Л. – Киев, 2010. – 94 с. (Препринт / Институт программных систем НАН Украины). ISSN 1028-9763. Математичні машини і системи, 2012, № 3 115 9. Seuken S. Formal Models and Algorithms for Decentralized Decision Making under Uncertainty / S. Seuken, S. Zilberstein // Journal of Autonomous Agents and Multi-Agent Systems. – 2008. – № 17 (2). – P. 90 – 250. 10. Wu F. Trial-Based Dynamic Programming for Multi-Agent Planning [Електронний ресурс] / F. Wu, S. Zilberstein, X. Chen. – 2010. – 6 p. – Режим доступу: www.aaai.org. 11. Ильина Е.П. Оценка и использование показателей качества экспертного решения проблемы / Е.П. Ильина // Проблемы программирования. – 2006. – № 1. – С. 38 – 45. Стаття надійшла до редакції 05.12.2012