<<

стр. 4
(всего 6)

СОДЕРЖАНИЕ

>>

ванная эффективность стимулирования в АС с неопределенностью
не выше, чем в детерминированной АС, причем с ростом неопре-
деленности эффективность стимулирования уменьшается, а с
уменьшением неопределенности – возрастает и стремится к анало-
гичному показателю для соответствующей детерминированной
активной системы.
В одноэлементных моделях величина неопределенности свя-
зана с информированностью участников: чем большей информаци-
ей обладает центр и/или АЭ, тем меньше неопределенность. В
большинстве известных моделей считается, что участники АС,
обладая на момент принятия решения некоторой информацией,
могут использовать эту информацию и только ее. Возможность
получения дополнительной информации отсутствует (использова-
ние механизмов с сообщением информации от АЭ центру не явля-
ется исключением: несмотря на то, что центр получает новую
информацию, он получает ее после выбора процедуры планирова-
ния, причем сам факт обмена информацией изначально заложен в
механизме функционирования). Такой порядок функционирования
достаточно распространен на практике. Однако встречаются си-
туации, в которых участники АС имеют возможность до принятия
решения целенаправленно получать информацию от «окружающей
среды» или от других участников системы, причем, в большинстве
случаев, для получения этой информации необходимы некоторые
финансовые или какие-либо другие затраты.
Механизмы управления, в которых участники АС имеют воз-
можность за плату приобрести информацию, получили название
механизмов с платой за информацию [44]. При использовании
механизмов с платой за информацию имеют место две противопо-

97



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
ложные тенденции. С одной стороны, получение дополнительной
информации может повысить эффективность управления. С другой
стороны, часть средств, потраченная на приобретение информации,
уменьшает доход участника АС или его возможности по управле-
нию, что может привести к снижению эффективности управления.
Если точность и количество поступающей информации монотонно
связаны с затратами по ее получению, то, очевидно, существует
некоторый оптимум - компромисс между снижением эффективно-
сти, вызванным уменьшением управляющих возможностей, и ее
ростом, обусловленным большей информированностью. При этом
не исключается, что возможны ситуации, в которых приобретать
дополнительную информацию вообще не имеет смысла (плата
слишком высока), или наоборот, оказывается целесообразным
полное устранение неопределенности.
Существенной чертой механизмов с платой за информацию
является добровольность ее приобретения: каждый из участников
АС вправе самостоятельно решать приобретать ли ему дополни-
тельную информацию и в каком объеме. Понятно, что, в принципе,
приобретать информацию могут как центр, так и активные элемен-
ты. Важно также различать, у кого приобретается информация - у
третьих лиц, не входящих в состав АС, или у участников самой
активной системы. Так, например, возможны механизмы с сооб-
щением информации в АС, в которых центр может, заплатив АЭ
определенную сумму, например, уменьшить диапазон возможных
(неизвестных для него) значений неопределенного параметра, а
затем использовать механизм планирования уже в условиях мень-
шей неопределенности. Задача манипулирования [42] при этом все
равно возникает, однако, следует учитывать, что плата за инфор-
мацию может изменить значение целевой функции АЭ.
Для получения ответа на вопрос целесообразно ли использо-
вание механизмов с платой за информацию и определения опти-
мальной величины этой платы, необходимо в каждом конкретном
случае: определить зависимость информированности участников
АС от величины платы за информацию; найти соотношение между
эффективностью управления и информированностью участников
(величина платы за информацию выступает при этом как пара-


98



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
метр); вычислить величину платы за информацию, максимизи-
рующую эффективность управления.
Аналогичные рассуждения справедливы, видимо, и для много-
элементных АС с неопределенностью и могут рассматриваться как
«программа» их исследования. Ниже описывается ряд моделей
многоэлементных АС с неопределенностью, которые исследуются
в соответствии с приведенной выше методикой.
Таким образом, на сегодняшний день имеются единые мето-
дологические подходы (и полученные в рамках этих подходов
конструктивные результаты) к исследованию как многоэлемент-
ных детерминированных АС, так и одноэлементных АС с неопре-
деленностью. Полное и систематическое исследование всех моде-
лей многоэлементных АС с неопределенностью представляется
задачей, не актуальной на сегодняшний день по следующим при-
чинам. Во-первых, многообразие этих моделей слишком велико
(см. сноску выше). Во-вторых, отличаются эти модели не столь
сильно: из предшествующего изложения материала настоящей
работы видно, что все восемь базовых моделей многоэлементных
детерминированных АС имеют много общего, если не в описании,
то в методах их исследования; кроме того сформулирован единый
подход к анализу задач стимулирования в условиях неопределен-
ности. Следовательно, можно предположить, что в первом при-
ближении при исследовании той или иной конкретной модели
многоэлементной АС с неопределенностью можно ограничиться
адаптированным применением упомянутых подходов (некоторые
примеры приведены ниже). Поэтому в настоящей главе основной
акцент делается на выявление специфики многоэлементных АС с
неопределенностью как по сравнению с детерминированными
многоэлементными АС, так и по сравнению с одноэлементными
АС с неопределенностью. Кроме того, как следует из материала
предыдущих шести разделов, одни базовые модели стимулирова-
ния в многоэлементных АС являются частными случаями других,
поэтому ниже мы ограничимся изучением факторов неопределен-
ности в двух наиболее сложных моделях с несепарабельными
затратами: S4 (стимулирование каждого АЭ зависит от действий
всех АЭ) и S6 (стимулирование каждого АЭ зависит от результата
деятельности АС в целом).

99



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
7.1. ВНУТРЕННЯЯ НЕОПРЕДЕЛЕННОСТЬ

Под внутренней неопределенностью понимают неполную ин-
формированность части участников АС о параметрах самой АС.
Рассмотрим случай асимметричной информированности без сооб-
щения информации1. Так как исследователь операций стоит на
позициях оперирующей стороны – центра, то обычно предполага-
ется, что он менее информирован, чем активные элементы.
Пусть внутренними параметрами, неизвестными центру, яв-
ляются параметры {ri} функций затрат АЭ: ci(y, ri), i ? I. То есть
будем считать, что на момент принятия решений (выбора действия
при известной функции стимулирования) i-ый АЭ знает истинное
значение параметра ri, а центр как на момент принятия решений (то
есть на момент выбора функции стимулирования), так и в даль-
нейшем2, не знает его, а имеет некоторую информацию.
В зависимости от той информации, которой обладает центр,
различают интервальную неопределенность (когда центру известно
множество [di; Di] возможных значений параметра ri, i ? I), вероят-
ностную неопределенность (когда центру дополнительно известно
вероятностное распределение pi(ri), i? I) и нечеткую неопределен-
ность (когда центр имеет нечеткую информацию – знает функцию
˜
принадлежности параметра: Pi : [di; Di] > [0; 1], i ? I).
Рассмотрим последовательно три случая: интервальной, веро-
ятностной и нечеткой внутренней неопределенности участников
при асимметричной информированности.

1
Как отмечается в [16], в АС с асимметричной информированностью
одним из эффективных способов снижения неопределенности является
сообщение информации от более информированных участников менее
информированным (то есть от АЭ – центру). При этом возникают
задачи построения неманипулируемых механизмов (в которых АЭ выгод-
но сообщать достоверную информацию) и др., заслуживающие отдель-
ного исследования и выходящие за рамки настоящей работы.
2
Если после выбора АЭ действия центру становится известным истин-
ное значение параметра функции затрат АЭ, то возможно использова-
ние механизмов гибкого планирования [4, 33], в которых вознаграждение
АЭ параметрически зависит от r.
100



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
7.1.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ

Пусть в n-элементной АС типа S4 функции затрат АЭ имеют
вид: ci(y, ri), i ? I, а относительно параметров ri центру известны
множества ?i = [di; Di] их допустимых значений. Равновесие Нэша
EN(?, r), где r = (r1, r2 , …, rn), естественно, зависит от истинных
значений параметров функций затрат и используемой центром
системы стимулирования:
(1) EN(?, r) = {yN ? A’ | ? i ? I, ? yi ? Ai
?i(yN) – ci(yN, ri) ? ?i( y ?i , yi) – ci( y ?i , yi, ri)}.
N N


? ?i .
Обозначим ? = Определим эффективность системы
i?I
стимулирования ? ? M. Если при использовании центром системы
стимулирования ? и при векторе r параметров функций затрат АЭ
множество равновесий Нэша есть EN(?, r), то в рамках гипотезы
благожелательности эффективность стимулирования K(?) равна
максимальному (по множеству равновесий Нэша) значению целе-
вой функции центра. Это значение зависит от неопределенного
параметра r ? ?. Используя для устранения этой неопределенности
МГР, получаем:
(2) K(?) = min max {H(y) - ? ci ( y , ri ) }.
r?? y?E N (? ,r ) i?I
Решение задачи K(?) > max , где K(?) определяется выраже-
? ?M
нием (2), является достаточно сложной задачей. Поэтому восполь-
зуемся методом анализа минимальных затрат на стимулирование
совместно с идеей декомпозиции игры АЭ.
Фиксируем некоторый вектор действий y* ? A’. Из результата
теоремы 4.4.1 следует, что, если бы вектор r был известен, то
минимальные затраты на стимулирование по реализации вектора
действий y* ? A’ равнялись бы следующей величине:
(3) ?(y*, r) = ? ci ( y * , ri ) .
i?I
Оптимальное решение задачи синтеза оптимальной системы
стимулирования в условиях интервальной неопределенности дает-
ся следующей теоремой.
101



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Теорема 7.1.1. Система стимулирования (с параметром y*):
?max ci ( yi* , y ?i , ri ) + ? i , yi = yi*
?
(4) ? i (y*, y) = ? ri??i , i ? I,
? 0, yi ? yi
*
?
где оптимальное значение y * параметра y* является решением
Г
задачи:
(5) y * = arg max {H(y) - ?Г(y)}, где
Г
y?A

? max ci ( y, ri ) ,
(6) ?Г(y) =
r ??
i?I i i

?-оптимальна.
Доказательство. Из доказательства теоремы 4.4.1 следует, что
для того, чтобы действие yi* было доминантной стратегией i-го
АЭ, следует использовать компенсаторную систему стимулирова-
ния (см. выражение (1б) в разделе 4.4 выше). Кроме этого, для
того, чтобы побудить i-го АЭ выбрать действие yi* необходимо,
как минимум, компенсировать ему затраты (условие индивидуаль-
ной рациональности). Максимально возможные (в рамках сущест-
вующей информированности центра) затраты АЭ при выборе этого
действия (и при обстановке игры y-i) равны max ci ( yi* , y ?i , ri ) ,
ri??i
i ? I.
Следовательно система стимулирования (4) гарантированно
реализует вектор действий y* ? A’ с минимальными затратами
центра на стимулирование, определяемыми выражением (6).
Имея минимальные затраты по гарантированной реализации
произвольного вектора действий АЭ, можно решить задачу опти-
мального согласованного планирования, то есть найти допустимый
вектор действий y * , который доставляет максимум разности
Г
между функцией дохода центра и его затратами на стимулирование
по гарантированной реализации этого вектора действий (см. выра-
жение (5)). •
Отметим, что сравнение выражений (3) и (6) позволяет пред-
ложить следующий «качественный» метод решения задач стиму-

102



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
лирования в многоэлементных АС с внутренней интервальной
неопределенностью и асимметричной информированностью: сле-
дует в качестве затрат АЭ рассматривать максимально возможные
его (в рамках имеющейся информированности центра) затраты,
после чего задача сводится к детерминированной задаче стимули-
рования в модели S4, методы решения которой подробно описаны
в разделе 4.4.
Исследуем роль неопределенности, то есть ее влияние на га-
рантированную эффективность стимулирования. Понятно, что,
если неопределенность отсутствует, то есть ?i = ri, i ? I, то резуль-
тат теоремы 7.1.1 переходит в результат теоремы 4.4.1.
Напомним, что в случае интервальной неопределенности кри-
терием сравнения информированностей центра служит вложен-
ность множеств возможных значений неопределенных параметров
[44].
Следствие 7.1.2. С ростом неопределенности гарантированная
эффективность стимулирования (в многоэлементной АС с внут-
ренней интервальной неопределенностью и асимметричной ин-
формированностью) не возрастает. С уменьшением неопределен-
ности гарантированная эффективность стимулирования возрастает
и стремится к гарантированной эффективности стимулирования в
соответствующей детерминированной модели.
Справедливость утверждения следствия следует из сравнения
выражений (3) и (6) и теоремы о минимальных затратах на стиму-
лирование [42].
Пример 10. Пусть в АС имеются два АЭ со следующими
( y i + ? y ?i ) 2
, i = 1, 2, где ? < 1 - неко-
функциями затрат: ci(y) =
2ri
торый параметр (см. также для сравнения примеры 4 и 8). Пусть
функция дохода центра H(y) = y1 + y2. Предполагая существование
внутреннего решения, получим следующую зависимость опти-
мальных с точки зрения центра действий АЭ от параметров их
функций затрат:
ri ? ? r?i
(7) yi* = , i=1, 2.
1 ?? 2
Максимальное значение целевой функции центра ?* зависит
103



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
от вектора r неопределенных параметров следующим образом:
1??
(8) ?*(r) = ( r1 + r2 ) .
1 +?
Из выражения (8) следует, что максимальное значение целевой
функции центра монотонно по r. В то же время, функции затрат АЭ
убывают с ростом r, поэтому при вычислении МГР целевая функ-
ция центра минимизируется на множестве возможных значений
r ? ?. Снижение неопределенности соответствует уменьшению
множества ?. С уменьшением множества, по которому вычисляет-
ся минимум, значение самого минимума не уменьшается. Следова-
тельно, с увеличением информированности центра гарантирован-
ная эффективность стимулирования не убывает. •


7.1.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ

Пусть в n-элементной АС типа S4 функции затрат АЭ имеют
вид: ci(y, ri), i ? I, а относительно параметров ri центру известны
множества ?i = [di; Di] их допустимых значений и распределения
вероятностей pi(ri), с носителем ?i. Обозначим p(r), r ? ?, – рас-
пределение вектора параметров функций затрат АЭ, и для опреде-
ленности предположим, что ? y ? A’ функции ci(y, ri) непрерывны
и убывают по ri, i ? I.
Рассмотрим возможные подходы к определению эффективно-
сти системы стимулирования ? ? M. Так как, помимо диапазона
возможных значений параметра функции затрат АЭ, центру из-
вестно его вероятностное распределение, то в соответствии с
принципами устранения неопределенности, приведенными в [44],
рациональность поведения центра будет заключаться в вычислении
и максимизации математического ожидания своей целевой функ-
ции, то есть в использовании оценки ожидаемой полезности. Вся
проблема заключается в согласовании определения ожидаемой
полезности с определением решения игры АЭ (в одноэлементных
АС такая проблема, естественно, не возникала).
Предположим, что центр использует в рамках ГБ следующую
оценку эффективности системы стимулирования ? ? M:
104



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
? {H(y) - ?(y)} p(r) dr.
max
(1) K(?) =
y?E N (? ,r )
?
Однако, использование усреднения по множеству равновесий
Нэша (максимум max в выражении (1) стоит под интегралом)
y?E N (? ,r )
неправомочно по следующей причине. Пусть мы определили сис-
тему стимулирования, максимизирующую (1). При ее использова-
нии центром в общем случае может оказаться, что параметры
функций затрат АЭ таковы, что действие, на котором достигается
максимум подынтегрального выражения не будет являться равно-
весием Нэша1 при данных функциях затрат и данной функции
стимулирования. Примером может служить случай, когда центр
компенсирует АЭ затраты, то есть использует систему стимулиро-
вания с параметром r, оптимальную при каждом фиксированном
значении этого параметра (см. выражение (1б) в разделе 4.4.1 и
выражения (3)-(6) в разделе 7.1.1). Следовательно, необходимо
другое (отличное от (1)) определение эффективности системы
стимулирования.
Можно рассмотреть случай, когда центр определяет эффек-
тивность системы стимулирования следующим образом. Обозна-
чим Fi(ri) – соответствующую плотности pi(ri) интегральную функ-
цию распределения, i ? I. Пусть центр использует следующую
«компенсаторную» систему стимулирования:
?ci ( yi* , y ?i , ti ) + ? i , yi = yi*
(2) ? i (y , y, t) = ? , i ? I.
*

yi ? yi*
? 0,
Тогда, в рамках введенного выше предположения о монотон-
ном убывании функций затрат с ростом значения неопределенного
параметра и предположений А.1 - А.3, введенных в разделе 2, i-ый
АЭ с вероятностью (1 – Fi(ti)) выбирает действие, совпадающее с

1
Отметим, что при определении равновесия Нэша в случае внутренней
интервальной неопределенности (см. выражение (1) в разделе 7.1.1)
знание каждым АЭ истинных значений параметров функций затрат
других АЭ было «не очень» существенно, так как использованием систе-
мы стимулирования (4) центр декомпозировал игру АЭ. В случае вероят-
ностной неопределенности предположения о знании или незнании i-ым
АЭ вектора r-i становится существенным.
105



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
yi* (так как в этом случае его затраты не больше, чем ci(y*, ti)), и с
вероятностью Fi(ti) – нулевое действие. Следовательно, для фикси-
рованного вектора действий y* ? A’ можно определить оптималь-
ное (с точки зрения эффективности и риска) значение ti* , i ? I, а
затем уже решать задачу выбора оптимального вектора действий
АЭ.
Описанная схема принятия решений (центром) в условиях не-
определенности кажется несколько неестественной, поэтому мож-
но рекомендовать использовать для устранения неопределенности
принцип МГР (фактически, отказываясь от части информации1, то
есть заменять вероятностную неопределенность интервальной) или
использовать механизмы с сообщением информации (см. замеча-
ние выше).

7.1.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ

Пусть в n-элементной АС типа S4 функции затрат АЭ имеют
вид: ci(y, ri), i ? I, а относительно параметров ri центру известны
множества ?i = [di; Di] их допустимых значений и функции при-
надлежности ˜i ( ri ) , с носителем ?i, ˜i : ?i > [0; 1], i ? I.
p p
Если определять эффективность стимулирования непосредст-
венно с использованием нечетких информационных функций, то
возникнут проблемы, аналогичные описанным выше для случая
вероятностной неопределенности в разделе 7.1.2, что приведет к
необходимости использования пессимистичных оценок, то есть
принципа МГР. Поэтому рассмотрим альтернативный подход.
Имея информацию о четкой функции затрат АЭ ci(y, ri) (с точ-
ностью до значения параметра ri), можно, в соответствии с прин-
ципом обобщения [35, 44], определить нечеткую функцию затрат
˜ ˜
АЭ: ci ( y , u ) , ci : A’ ? ?1 > [0; 1], i ? I.

1
Качественное этот эффект можно объяснить следующим образом:
имеющаяся у центра информация о вероятностном распределении не
позволяет «разумно» согласовать его информированность с информиро-
ванностью АЭ (равновесием Нэша).
106



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Введем следующее определение (по аналогии с тем как это де-
лалось в [34] для нечеткой функции дохода): нечеткая функция
˜
затрат ci ( y , u ) согласована1 с четкой функцией затрат ci(y), если
? y ? A’, i ? I выполнено:
˜
1) ci ( y , c( y )) = 1;
˜ ˜
2) ? u1, u2: u1 ? u2 ? c(y) ci ( y , u1 ) ? ci ( y , u2 ) ;
˜ ˜
3) ? u1, u2: c(y) ? u1 ? u2 ci ( y , u1 ) ? ci ( y , u2 ) .
Предположим, что всем АЭ известны четкие функции дохода
{ci(y)}, удовлетворяющие предположениям А.1-А.3 (см. раздел 2), а
˜
центру известны нечеткие функции затрат АЭ { ci ( y , u ) }, согласо-
ванные с соответствующими четкими функциями затрат.
˜
Если нечеткие функции затрат ci ( y , u ) , i ? I, таковы, что
˜
? y ? A’ равенство ci ( y , u ) = 1 выполнено тогда и только тогда,
˜
когда u = c(y) и функции { ci ( y , u ) } согласованы с соответствую-
щими четкими функциями затрат, то, очевидно, получается четкая
(детерминированная) задача, для которой может быть использован
результат теоремы 4.4.1.
Введем рассмотрение следующие четкие «функции затрат»2:
˜
(1) cimax ( y ) = max {u ? ?1 | ci ( y , u ) = 1}, i ? I.
Обозначим
?
(2) ?Г(y) = cimax ( y ) .
i?I

1
Введенное определение согласованности представляется вполне есте-
ственным и легко интерпретируемым: имеющаяся у центра нечеткая
информация не должна противоречить реальным значениям параметров
функций затрат АЭ.
2
Несколько забегая вперед, сделаем следующее качественное замечание:
к «функциям затрат» (1) ниже будет применена теорема 4.4.1, что
совместно с условиями согласованности соответствующих четких и
нечетких функций затрат АЭ позволит доказать ?-оптимальность
системы стимулирования, компенсирующей затраты (1) (см. для сравне-
ния выражения (4)-(6) в разделе 7.1.1). Другими словами, конструкция,
типа выражения (1), является результатом совместного применения
определения согласованности и принципа МГР.
107



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Теорема 7.1.3. Система стимулирования (с параметром y*):
?cimax ( yi* , y ?i ) + ? i , yi = yi*
(3) ? i (y , y) = ? , i ? I,
*

yi ? yi*
? 0,
где оптимальное значение y * параметра y* является решением
Г
задачи:
(4) y * = arg max {H(y) - ?Г(y)},
Г
y?A
?-оптимальна.
Доказательство. Из доказательства теоремы 4.4.1 (см. также
доказательство теоремы 7.1.1) следует, что для того, чтобы дейст-
вие yi* было доминантной стратегией i-го АЭ, следует использо-
вать компенсаторную систему стимулирования (см. выражения
(1б) в разделе 4.4 и выражение (4) в разделе 7.1).
Кроме этого, для того, чтобы побудить i-ый АЭ выбрать дей-
ствие yi* необходимо, как минимум, компенсировать ему затраты
(условие индивидуальной рациональности). Из предположения о
том, что нечеткие функции затрат АЭ, известные центру, согласо-
ваны с их четкими функциями затрат, и выражения (1) следует, что
оценка сверху возможных (в рамках существующей информиро-
ванности центра) затрат АЭ при выборе этого действия (и при
обстановке игры y-i) равны cimax ( yi* , y ?i ) , i ? I.
Следовательно система стимулирования (3) гарантированно
реализует вектор действий y* ? A’ с минимальными затратами
центра на стимулирование, определяемыми выражением (2).
Имея минимальные затраты по гарантированной реализации
произвольного вектора действий АЭ, можно решить задачу опти-
мального согласованного планирования, то есть найти допустимый
вектор действий y * , который доставляет максимум разности
Г
между функцией дохода центра и его затратами на стимулирование
по гарантированной реализации этого вектора действий (см. выра-
жение (4)). •
Исследуем роль неопределенности. Понятно, что, если неоп-


108



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
?1, ti = ri
ределенность отсутствует, то есть ˜i (ti ) = ? , i ? I, (при
p
?0, ti ? ri
?1, u = ci ( y )
этом ˜i ( y , u ) = ? , i ? I), то результат теоремы 7.1.3
c
?0, u ? ci ( y )
переходит в результат теоремы 4.4.1.
Напомним, что в случае нечеткой неопределенности критери-
ем сравнения информированностей центра служит вложенность
нечетких множеств неопределенных параметров [44]. Другими
˜
словами, при нечеткой функции затрат АЭ c 1i ( y , u ) информиро-
ванность центра меньше, чем при нечеткой функции затрат АЭ
˜
c 2 i ( y , u ) , если выполнено:
˜ ˜
(5) ? y ? A’, ? u ? ? 1 c 1i ( y , u ) ? c 2 i ( y , u ) .
Следствие 7.1.4. С ростом неопределенности гарантированная
эффективность стимулирования (в многоэлементной АС с внут-
ренней нечеткой неопределенностью и асимметричной информи-
рованностью) не возрастает. С уменьшением неопределенности
гарантированная эффективность стимулирования возрастает и
стремится к гарантированной эффективности стимулирования в
соответствующей детерминированной модели.
Справедливость утверждения следствия следует из теоремы о
минимальных затратах на стимулирование [42] с учетом того, что,
если выполнено (5), то, очевидно, имеет место следующее соотно-
шение: ci1max ( y ) ? ci2 max ( y ) , i ? I.
Пример 11. Пусть в АС имеются два АЭ со следующими
( y i + ? y ?i ) 2
, i = 1, 2, где ? < 1 -
функциями затрат: ci(y, ri) =
2ri
некоторый параметр (см. также для сравнения примеры 4, 8 и 10).
Пусть функция дохода центра H(y) = y1 + y2, а нечеткая функция
затрат имеет вид:
?1, u ? [ci ( y , Di ); ci ( y , d i )]
(6) ˜i ( y , u ) = ? , i ? I,
c
?0, u ? [ci ( y , Di ); ci ( y , d i )]
где di ? Di, i ? I, - некоторые константы.
109



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
В соответствии с выражением (1) вычисляем:
cimax ( y ) = ci(y, di), i ? I.
Замечая, что мы оказались в условиях примера 10, воспользуемся
1??
выражением (8) из раздела 7.1.1 и вычислим: ?* = ( d1 + d 2 ) .
1+ ?
Таким образом, результаты, полученные для интервальной и для
нечеткой внутренней неопределенности, согласованы. •

7.2. ВНЕШНЯЯ НЕОПРЕДЕЛЕННОСТЬ

Под внешней неопределенностью понимают неполную ин-
формированность части участников АС о параметрах окружающей
среды (состоянии природы), то есть параметрах, внешних по от-
ношению к рассматриваемой АС. Рассмотрим случай симметрич-
ной информированности участников АС относительно неопреде-
ленных факторов, при которой и центр, и АЭ имеют одинаковую
информацию о состоянии природы, но, быть может, асимметрично
информированы относительно других показателей функциониро-
вания АС.
Пусть затраты АЭ ci(y), i ? I, несепарабельны, зависят от дей-
ствий АЭ и достоверно известны центру1.
Неопределенность (неполная информированность) участников
АС относительно состояния природы учитывается в модели сле-
дующим образом.
Будем считать, что действия АЭ y = (y1, y2, …, yn) ? A’ совме-
стно с состоянием природы ? = (?1, ?2, …, ?n) ? ? приводят к тому,
что реализуется некоторый результат деятельности АС
z = (z1, z2 ,…, zn) ? A0, причем каждая компонента результата дея-
тельности zi ? A0i , i ? I, A0 = ? A0i , зависит от действий всех АЭ
i?I

1
То есть будем считать, что на момент принятия решений (выбора
действия при известной функции стимулирования) i-ый АЭ знает истин-
ное значение параметра ri, и центр также на момент принятия решений
(то есть на момент выбора функции стимулирования) знает его, то
есть имеет достоверную информацию.
110



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
и соответствующей компоненты состояния природы, то есть имеет
место:
(1) zi = zi(y, ?i), i ? I,
где функции («технологические» зависимости [9, 59]) {zi(?,?)},
наряду с допустимыми множествами ?i ? ?i, ? = ? ? i , известны
i?I
центру и всем АЭ.
Относительно целевых функций и допустимых множеств, до-
полнительно к предположениям А.1-А.4, примем следующее пред-
положение:
А.7.1. ? i ? I A0i = Ai; зависимости zi(y, ?i) непрерывны по
всем переменным и однозначны.
Содержательно, предполагается, что множества возможных
действий и результатов деятельности каждого АЭ совпадают.
Наиболее распространенной (см. [44]) интерпретацией такого
предположения является представление состояния природы как,
например, аддитивной «помехи», накладываемой на действие АЭ.
Порядок функционирования и информированность участников
АС следующие: центр сообщает АЭ систему стимулирования
{?i(z)}, то есть совокупность зависимостей индивидуальных возна-
граждений АЭ от результата деятельности АС, после чего АЭ
выбирают свои действия, ненаблюдаемые для центра1. Принципи-
ально важно, что в рассматриваемой модели ни центр, ни АЭ, на
момент выбора стратегий не знают значения состояния природы,
которое реализуется после выбора ими стратегий и приведет к
некоторому (единственному в силу предположения А.7.1) резуль-
тату деятельности. Наблюдаемый и центром, и АЭ результат дея-
тельности определяет вознаграждение АЭ и доход центра.2
1
Ненаблюдаемость для центра действий АЭ объясняет то, что их
вознаграждение зависит от наблюдаемого результат деятельности.
Если бы действия АЭ были наблюдаемы, то центр мог бы основывать
стимулирование на выбираемых АЭ действиях и «забыть» о неопреде-
ленности», то есть задача свелась бы к детерминированной задаче
стимулирования, которая подробно описана выше.
2
Следует отметить, что рассматриваемая модель является обобщени-
ем известной одноэлементной модели стимулирования в условиях неопре-
деленности, подробно описанной в работах [8,20, 35-44, 54] (см. также
111



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Опишем целевые функции участников АС. Целевая функция
центра представляет собой разность между доходом, зависящим от
действий АЭ1, и суммарными затратами на стимулирование:
(2) ?(z, y) = H(y) - ? ? i ( z) .
i?I
Целевая функция АЭ есть разность между его вознаграждени-
ем и затратами, зависящими в силу несепарабельности от действий
всех АЭ:
(3) fi(z, y) = ?i(z) – ci(y), i ? I.
Отметим, что целевые функции участников АС зависят как от
выбираемых ими стратегий (функций стимулирования и действий),
так и от неопределенных факторов (результатов деятельности,
которые действительно являются неопределенными, так как зави-
сят от состояния природы). Поэтому необходимо конкретизировать
принципы рационального поведения участников АС, то есть прин-
ципы выбора ими стратегий в условиях имеющейся неопределен-
ности. Для этого необходимо четко определить, какой информаци-
ей о состоянии природы они обладают.
В зависимости от той информации, которой обладает участник
АС (центр и АЭ), различают интервальную неопределенность
(когда известно множество ?i возможных значений параметра ?i,
i ? I), вероятностную неопределенность (когда дополнительно
известно вероятностное распределение pi(?i), i? I) и нечеткую
неопределенность (когда имеется нечеткая информация – функция
˜
принадлежности состояния природы параметра: Pi : ?i > [0; 1],
i ? I) (ниже последовательно рассматриваются три случая: интер-
вальной, вероятностной и нечеткой внешней неопределенности


обзоры [9, 10, 34]).
1
Если функция дохода центра (и/или функции затрат АЭ) зависит от
результатов деятельности, то, устраняя неопределенность, можно
перейти к соответствующим функциям, зависящим от действий АЭ (см.
подробности в [9, 42, 44]). При этом если функции затрат АЭ зависят
от результатов деятельности других АЭ, которые в свою очередь зави-
сят от действий всех АЭ, то при определении равновесия Нэша (см.
выражение (4) ниже) существенным становится наблюдаемость каж-
дым активным элементом действий всех АЭ.
112



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
участников АС при симметричной их информированности).
Вернемся к обсуждению рационального поведения. В соответ-
ствии с общей методологией принятия решений в условиях неоп-
ределенности [42, 44, 66] игроки устраняют неопределенность с
использованием всей имеющейся у них информации, сводя тем
самым задачу принятия решений к детерминированной. Интер-
вальная неопределенность устраняется, как правило, применением
принципа МГР, вероятностная неопределенность – переходом к
ожидаемой полезности (вычислением математического ожидания
полезности (целевой функции) по известному распределению
вероятности), нечеткая неопределенность – переходом к НОП,
индуцированному на множестве допустимых действий целевой
˜
функцией АЭ (3) и нечеткой информационной функцией Pi [44].
Прежде чем переходить к изучению многоэлементных АС с
внешней неопределенностью, рассмотрим детерминированный
аналог предложенной модели, который в дальнейшем будет яв-
ляться той «точкой отсчета», для которой будет проверяться вы-
полнение принципа соответствия, относительно которой будет
изучаться роль неопределенности и т.д. (см. введение к настояще-
му разделу).
Итак, предположим, что участники АС на момент принятия
решений имеют достоверную информацию о состоянии природы.
Запишем определение равновесия Нэша (решения игры АЭ), кото-
рое зависит от используемой центром системы стимулирования и
состояния природы:
(4) EN(?, ?) = {yN ? A’ | ? i ? I, ? yi ? Ai
?i(z1(yN, ?1), z2(yN, ?2), …, zn(yN, ?n)) – ci(yN) ?

? ?i(z1( y ?i , yi, ?1), z2( y ?i , yi, ?2), …, zn( y ?i , yi, ?n)) – ci( y ?i , yi)}.
N N N N


В условиях полной информированности представляют интерес
следующие варианты:
Вариант 1. Функция дохода центра и функции затрат АЭ зави-
сят от действий АЭ, которые наблюдаются всеми участниками АС;
Вариант 2. Функция дохода центра зависит от наблюдаемого
им результата деятельности АС, а функции затрат АЭ – от их
действий, которые ненаблюдаемы для центра;
113



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Вариант 3. Функция дохода центра и функции затрат АЭ зави-
сят от действий АЭ, которые ненаблюдаемы для центра.
Первый вариант, как отмечалось выше, тривиален – центр мо-
жет основывать стимулирование на наблюдаемых действиях, то
есть получаем в точности детерминированную модель S4.
Рассмотрим второй вариант. Фиксируем произвольный вектор
y ? A’ действий АЭ. Тогда рассматриваемая модель (при фикси-
*

рованном r ? ?) принадлежит классу S6 моделей многоэлемент-
ных детерминированных АС, в которых стимулирование каждого
АЭ зависит от результата деятельности АС, определяемого (в
условиях отсутствия неопределенности) действиями АЭ при несе-
парабельных затратах. Специфика рассматриваемой модели за-
ключается в том, что оператор Q(?) в ней имеет следующий «век-
Q: A’ ? ? > A0,
торный» вид: или в «поэлементном»
представлении: Qi: A’ ? ?i > A0i , i ? I, причем значение (в каждом
конкретном случае) состояния природы является параметром.
Определим Y(z, ?) = {y ? A’ | z(y, ?) = z} ? A’, z ? A0 – множе-
ство тех действий АЭ, выбор которых при данном состоянии при-
роды приводит к реализации заданного результата их деятельности
z ? A0. При компенсации центром затрат активных элементов
минимальные затраты на стимулирование по реализации результа-
n
?
та деятельности z ? A0 равны: ?(z, ?) = ci(yi), а целевая
min
y?Y ( z ,? ) i =1

функция центра равна: ?(z, ?) = H(z) - ?(z, ?).
В соответствии с результатами раздела 4.6 на первом шаге ре-
шения задачи стимулирования определим множество векторов
действий АЭ, приводящих к заданному результату деятельности и
требующих минимальных затрат на стимулирование по своей
n
?
реализации: Y (z, ?) = Arg ci(y). Фиксируем произволь-
*
min
y?Y ( z ,? ) i =1

ный вектор y*(z, ?) ? Y*(z, ?) ? Y(z, ?). Тогда при использовании
центром системы стимулирования
?ci ( y * ( x (? )), z = x (? )
? i* (x(?), , i ? I,
z) = ?
(5)
z ? x (? )
? 0,
114



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
где x(?) ? A0 – параметр (план), результат деятельности x(?) ? A0
реализуется с минимальными затратами центра на стимулирование
(см. теорему 4.6.1).
Возможно использование более простых, чем (5) конструкций,
учитывающих специфику рассматриваемой модели. Например,
система стимулирования
? max ci ( y ) + ? i , z = z ( y , ? )
(6) ? i* (x(?), z) = ? y?Y ( z ,? ) , i ? I,
z ? z( y, ? )
?0,
где x(?) ? A0 – параметр (план), реализует результат деятельности
x(?) ? A0 как равновесие Нэша1 (естественно, система стимулиро-
вания (6) имеет не более высокую эффективность, чем оптималь-
ная система стимулирования (5)). Очевидно, что эффективности
совпадают в случае, когда по наблюдаемому результату деятельно-
сти и состоянию природы центр в состоянии восстановить дейст-
вия АЭ, то есть, например, когда выполнено: ? i ? I ? y1, y2 ? A’,
y1 ? y2, ? ? ? ? zi(y1, ?) ? zi(y2, ?) и ? i ? I ? y ? A’, ? ?1, ?2 ? ?,
?1 ? ?2, zi(y, ?1) ? zi(y, ?2).
Наиболее выгодный для центра результат деятельности АС
x (?) ? A0, который может рассматриваться как гибкий (зависящий
*

от состояния природы – см. выше) план, определяется как решение
задачи оптимального согласованного планирования:
x*(?) = arg max [H(z) - ?(z, ?)].
z? A0
Таким образом, второй вариант может рассматриваться как
частный случай модели S6. Аналогичным образом можно показать,
что третий вариант совпадает с моделью, описанной в разделе 4.7.
Итак, для рассматриваемой модели в условиях полной инфор-
мированности решение задачи стимулирование дается теоремами
4.2.1, 4.3.1, 4.4.1, 4.5.1, 4.6.1. Отметим, что системы стимулирова-
ния (5) и (6) реализуют соответствующие вектора действий АЭ как
равновесия Нэша. Гораздо сложнее обстоит дело с реализацией

1
По аналогии с результатами, полученными для модели S2, можно по-
требовать строгой положительности констант ?i, тем самым обеспе-
чить единственность равновесия Нэша, перейти к индивидуальному
стимулированию и т.д. (см. разделы 4.2 и 4.4).
115



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
определенных действий АЭ как равновесий в доминантных страте-
гиях. Для этого (опять же в соответствии с теоремами, приведен-
ными в четвертом разделе) необходимо, чтобы центр мог компен-
сировать каждому АЭ затраты независимо от обстановки игры при
условии, что данный АЭ выбрал требуемое действие. Для этого,
как минимум, необходимо, чтобы центр был в состоянии наблю-
дать или однозначно восстанавливать действие каждого АЭ. В
рассматриваемой (детерминированной!) модели это возможно
далеко не всегда (в общем случае – невозможно). Тем более за-
труднительна идентификация индивидуальных действий в услови-
ях, когда присутствует неопределенность относительно состояния
природы1. Поясним последнее утверждение.
Единственным достаточно подробно исследованным классом
задач стимулирования в многоэлементных АС с неопределенно-
стью являются задачи теории контрактов [63, 65], то есть задачи с
внешней вероятностной неопределенностью и симметричной
информированностью (см. классификацию в [44] и обзоры [9, 34]).
Для этого класса задач в рамках обобщения двушагового метода
[58-60] для конечных допустимых множеств задача стимулирова-
ния сводится к набору задач выпуклого программирования, обла-
дающих чрезвычайно высокой вычислительной сложностью.
Таким образом, общих подходов к аналитическому2 решению
многоэлементной задачи стимулирования в условиях неопределен-
ности, описанной выше, на сегодняшний день, к сожалению, не
существует. Следовательно, необходимо упрощать модель, стре-
1
Решение широкого класса задач теории контрактов, использующее
идею определения множеств действий АЭ, которые в условиях вероятно-
стной неопределенности могут приводить к наблюдаемым результатам
деятельности, приведено в находящейся в печати статье А.Д. Халезова
"Общее решение дискретной задачи центр-агент с симметричной ин-
формацией в условиях риска".
2
Для теории активных систем характерно стремление к поиску именно
аналитических решений, позволяющих исследовать зависимость опти-
мального решения от параметров модели АС (общие результаты о
структуре оптимального решения, конечно, также представляют
теоретический интерес, однако их использование на практике затруд-
нительно хотя бы в силу высокой вычислительной сложности соответ-
ствующих алгоритмов) [21, 44].
116



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
мясь получать конструктивные и содержательно интерпретируе-
мые теоретические результаты, которые могли бы в дальнейшем
найти применение на практике.
Поэтому упростим модель, введя предположение о том, что
результат деятельности каждого АЭ зависит только от его собст-
венного действия и соответствующей компоненты состояния при-
роды, то есть будем считать1, что zi = zi(yi, ?i), i ? I.
В этом случае возможно комбинированное применение идеи
декомпозиции игры АЭ и результатов исследования моделей сти-
мулирования в одноэлементных АС, функционирующих в услови-
ях неопределенности. Проиллюстрирует это утверждение, рас-
смотрев ряд моделей многоэлементных АС с интервальной,
вероятностной и нечеткой внешней неопределенностью при сим-
метричной информированности участников.

7.2.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ

Предположим, что всем участникам АС на момент принятия
решений известны множества {?i} возможных значений неопреде-
ленного параметра, а также «технологические» зависимости
{zi(?,?)}. Пусть: затраты АЭ несепарабельны и зависят от действий
АЭ, а центр использует стимулирование каждого АЭ, зависящее от
результатов деятельности всех АЭ. Тогда целевые функции центра
и АЭ имеют, соответственно, вид:
(1) ?(z, y) = H(y) - ? ? i ( z) ,
i?I
(2) f(z, y) = ?i(z) – ci(y).
Фиксируем некоторое значение параметра ? ? ? и запишем
определение равновесия Нэша:
(3) EN(?, ?) = {yN ? A’ | ? i ? I, ? yi ? Ai

1
Данное предположение частично декомпозирует игру АЭ – результат
деятельности каждого из них зависит уже только от его собственных
действий и состояния природы (но не зависит от действий других АЭ), в
то время как другие переменные – стимулирование и затраты – по-
прежнему зависят, соответственно, от результатов деятельности и
действий всех АЭ.
117



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
?i(zi( yiN , ?i), z-i( y ?i , ?-i))–ci(yN) ? ?i(zi(yi, ?i), z-i( y ?i , ?-i))–ci(yi, y ?i )}.
N N N

Предположим, что и центр, и АЭ при устранении неопреде-
ленности используют принцип МГР. Однако одного этого предпо-
ложения оказывается недостаточно для корректного определения
равновесия Нэша в рамках рассматриваемой модели. Действитель-
но, в выражении (3) можно брать min fi(y, ?) или решать систему
? i??i
неравенств (для i ? I) и т.д.
Другими словами, поиск решения игры в условиях неопреде-
ленности сталкивается с множеством как методологических, так и
«технических», трудностей, происхождение которых качественно
можно объяснить тем, что, фиксируя ? ? M и записывая определе-
ние множества решений игры при данной системе стимулирования,
мы обрекаем себя на поиск системы стимулирования, оптимальной
в соответствующем подмножестве M функционального простран-
ства, что само по себе является нетривиальной задачей.
Вспомним, что помимо метода анализа множеств реализуемых
действий для решения задачи стимулирования может использо-
ваться не менее эффективный метод анализа минимальных затрат
на стимулирование [44], который заключается в том, что для каж-
дого вектора действий АЭ ищется минимальная система стимули-
рования, его реализующая, а затем на этапе согласованного плани-
рования определяется оптимальный вектор реализуемых действий.
То есть при использовании метода анализа минимальных затрат на
стимулирование оптимизация производится в более простом про-
странстве (? n), чем пространство кусочно-непрерывных положи-
тельнозначных функций, которое приходится использовать при
применении метода множеств реализуемых действий.
Введем следующее предположение.
А.7.2. zi(?,?) – непрерывные однозначные строго монотонные
функции своих переменных, i ? I.
Обозначим Zi(yi, ?i) = {zi ? A0i | zi = zi(yi, ?i), ?i ? ?i} – мно-
жество тех результатов деятельности i-го АЭ, которые могут реа-
лизоваться при выборе им действия yi ? Ai и всевозможных состоя-
ниях природы.

118



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Теорема 7.2.1. Если выполнено предположение А.7.2, то сис-
тема стимулирования
?ci ( yi* , y ?i ), zi ? Z i ( yi* , ? i )
*
(4) ?i(y , zi) = ? , i ? I,
*

zi ? Z i ( yi , ? i )
*
? 0,
реализует (как равновесие Нэша) вектор действий y* ? A’, который
оптимален при условии
(5) y* ? Arg max {H(y) - ? ci ( y ) }.
y?A' i?I
Доказательство. Фиксируем произвольный вектор y* ? A’ дей-
ствий АЭ и запишем условия его гарантированной реализуемости
как равновесия Нэша системой стимулирования {?i}:
(6) ? ? ? ?, ? i? I, ? yi ? Ai ?i(y*, zi( yi* , ?i), z-i( y ? i , ?-i)) – ci(y*) ?
*


? ?i(y*, zi(yi, ?i), z-i( y ? i , ?-i)) – ci(yi, y ? i )}.
* *

Из условий индивидуальной рациональности АЭ (напомним,
что условие индивидуальной рациональности АЭ гласит, что в
равновесии значение его целевой функции должно быть неотрица-
тельно) следует, что должно быть выполнено:
(7) ? ? ? ?, ? i? I ?i(y*, zi( yi* , ?i), z-i( y ? i , ?-i)) ? ci(y*),
*

то есть левая часть неравенств (6) неотрицательна.
Так как системы неравенств (6) и (7) должны иметь место при
любом значении неопределенного параметра, то, если использо-
вать систему стимулирования {?i(z)} (в которой вознаграждение
каждого АЭ зависит от результатов деятельности всех АЭ), то
придется брать минимум в левых частях выражений (6) и (7) по
всему множеству ?. Поэтому лучше (с точки зрения гарантирован-
ной эффективности стимулирования) использовать систему инди-
видуального стимулирования {?i(zi)}. При ее использовании усло-
вие (7) примет вид:
(8) ? i? I, ? ?i ? ?i ?i(y*, zi( yi* , ?i)) ? ci(y*).
Система стимулирования (4) удовлетворяет ограничениям (8)
как равенствам. Докажем, что при ее использовании y* - точка
Нэша.
Из предположения А.7.2 следует, что ? i ? I ? y1 ? y2 ? Ai
симметрическая разность множеств Zi(y1, ?i) и Zi(y2, ?i) непуста:
119



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Zi(y1, ?i) ? Zi(y2, ?i) ? ?, то есть при использовании центром сис-
темы стимулирования (4) и выборе i-ым АЭ действия yi ? yi* все-
гда найдется такое состояние природы ?i ? ?i, при котором возна-
граждение АЭ будет равно нулю. Следовательно, система
стимулирования (4) гарантированно реализует вектор y* ? A’ как
равновесие Нэша1.
Выражение (5) означает, что центр побуждает АЭ выбрать
наиболее выгодное для себя (то есть максимизирующее разность
между доходом и затратами на стимулирование) гарантированно
реализуемое действие. •
Исследуем роль неопределенности. Сравнивая выражения (4)
и (1) (из раздела 4.2), замечаем, что затраты центра на стимулиро-
вание одинаковы в детерминированной модели и в рассматривае-
мой модели АС с внешней интервальной неопределенностью.
Содержательно это можно объяснить симметричной информиро-
ванностью центра и АЭ и «осторожностью» АЭ (использованием
ими МГР)2. Например, если бы сепарабельные затраты i-го АЭ
зависели от результата его деятельности, то центр был бы вынуж-
ден компенсировать ему max ci ( zi ) .
*
zi?Zi ( yi ,?i )
В предельном случае (при переходе к соответствующей де-
терминированной АС) теорема 7.2.1 переходит в теорему 4.2.1.

7.2.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ

Пусть затраты всех АЭ несепарабельны и зависят от результа-
тов деятельности, то есть ci = ci(z), i ? I. Предположим, что на

1
По аналогии с тем, как это делалось в теореме 4.2.1, можно в выраже-
ние (4) добавить константы {?i}, обеспечивающие единственность
равновесия Нэша, или наложить дополнительные ограничения (см. пунк-
ты а)-в) в теореме 4.2.1), обеспечивающие существование РДС (при
условии, что АЭ использует МГР) и т.д.
2
Если предположение центра, что АЭ используют МГР не оправдывает-
ся, то результат теоремы 7.2.1 не имеет места (см. для сравнения
анализ влияния неопределенности в разделе 7.1.1).
120



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
момент принятия решений участники АС обладают одинаковой
информацией о распределениях вероятностей {pi(zi, yi)} результа-
тов деятельности АЭ в зависимости от его действия, и «технологи-
ческих» зависимостях {zi(?,?)}.
К сожалению, на сегодняшний день даже для одноэлементных
АС, функционирующих в условиях внешней вероятностной неоп-
ределенности, не получены общие аналитические решения задач
стимулирования второго рода. Поэтому в настоящем разделе мы
рассмотрим модель, для которой решения одноэлементных задач
известны, проиллюстрировав эффективность использования идеи
декомпозиции игры АЭ в многоэлементной вероятностной АС.
Предположим, что распределения вероятностей (интегральные
функции распределения) имеют следующий вид (так называемая
модель простого АЭ):
? Fi ( zi ), zi < yi
(1) Fi ( zi , yi ) = ? , i ? I.
zi ? yi
? 1,
Для одноэлементной модели простого АЭ доказана оптималь-
ность компенсаторных систем стимулирования [16, 44].
Теорема 7.2.2. В рамках ГБ система стимулирования
?ci ( zi , z ?i ), zi ? yi*
*
(2) ?i(y , zi) = ? , i ? I,
*

zi > yi
*
? 0,
реализует (как равновесие Нэша) вектор действий y* ? A’, который
оптимален при условии1
(3) y* ? Arg max {H(y) - E ? ci ( z ) }.
y?A' i?I
Доказательство. В работах [16, 44] доказано, что в модели
простого АЭ стационарные точки полезности АЭ и его ожидаемой
полезности совпадают. По аналогии можно показать, что в много-
элементной АС при фиксированной обстановке игры совпадают
стационарные (по стратегии данного АЭ) точки полезности АЭ и
его ожидаемой полезности.
В соответствии с результатом теоремы 4.2.1 при использова-

1
Напомним, что “E” обозначает оператор вычисления математическо-
го ожидания.
121



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
нии центром системы стимулирования (2) вектор z* ? A0, z* = y*,
является «равновесием Нэша», то есть доставляет максимум целе-
вой функции АЭ при фиксированных результатах деятельности
остальных АЭ. Следовательно, при фиксированной обстановке
игры он доставляет максимум и ожидаемой полезности АЭ, то есть
y* - равновесие Нэша. При этом компенсаторная система стимули-
рования (2) является минимальной, то есть характеризуется мини-
мальными затратами центра на стимулирование.
Ожидаемые затраты центра на стимулирование равны:
*
yi
(4) E ? ci ( z ) = ?? { ? ci ( zi , z ?i ) pi ( zi ) dzi +
i?I i?I A0 0
?i

[1 - Fi( yi* )] ci( yi* )} p-i(z-i, y ?i ) dz-i.
*

Подставляя (4) в целевую функцию центра, получаем условие
оптимальности (3). •
В предельном случае (при переходе к соответствующей де-
терминированной АС) теорема 7.2.1 переходит в теорему 4.2.1, а
выражение (4) в ? ci ( y * ) .
i?I


7.2.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ

Рассмотрим следующую модель многоэлементной АС с нечет-
кой внешней неопределенностью и симметричной информирован-
ностью участников. Пусть: вектор результатов деятельности АЭ z
принадлежит компакту A0 в ? n; затраты АЭ зависят от результатов
деятельности и несепарабельны, а функция дохода центра зависит
от действий АЭ.
Информированность участников АС следующая: на момент
принятия решений и центр, и АЭ имеют нечеткую информацию о
состоянии природы и «технологических» зависимостях {zi(?,?)}. В
соответствии с принципом обобщения [35] этого достаточно, что-
˜
бы определить нечеткую информационную функцию P (z, y),
˜
P : A0 ? A’ > [0; 1], ставящей в соответствие вектору действий АЭ
нечеткое подмножество множества результатов деятельности.

122



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Обозначим
˜
(1) Q(z) = {y ? A’ | P (z, y) = 1}.
˜
(2) Z(y) = {z ? A0 | P (z, y) = 1}.
Введем следующие предположения.
˜
А.7.3. Нечеткие функции P (z, y) 1-нормальны [35, 41, 44], то
˜ ˜
есть ? y ? A’ ? z ? A0: P (z, y) = 1 и ? z ? A0 ? y ? A’: P (z, y) = 1.
Если выполнено предположение А.7.3, то ? y ? A’ ? z ? A0
Q(z) ? ?, Z(y) ? ?.
Более сильным, чем А.7.3 является следующее предположе-
ние:
А.7.4. А.7.3 и U Q ( z ) = A’, U Z ( y ) = A0.
z?A0 y ? A'
А.7.5. Целевые функции АЭ и нечеткая информационная
˜
функция P (z, y) полунепрерывны сверху1.
z
Обозначим E N (? ) - множество равновесных по Нэшу резуль-
татов деятельности АЭ:
(3) E N (? ) = {zN ? A0 | ? i? I, ? zi ? A0i
z


?i(zN) – ci(zN) ? ?i(zi, z ?i ) – ci(zi, z ?i )}.
N N

Обозначим EN(?) – множество равновесных по Нэшу при ис-
пользовании центром системы стимулирования ? векторов дейст-
вий АЭ.
Лемма 7.2.1. Если выполнены предположения А.7.3–А.7.5, то
(4) EN(?) = U Q ( z ) .
z
z?E N (? )
Доказательство. Фиксируем i ? I. Целевая функция i-го АЭ и
˜
нечеткая информационная функция P (z, y) индуцируют на множе-
стве A’ нечеткое отношение предпочтения (НОП) i-го АЭ. В теории
принятия решений при нечеткой исходной информации рацио-
нальным считается выбор АЭ максимально недоминируемых по
его НОП альтернатив (действий).

1
Очевидно, что, если затраты АЭ непрерывны, и центр использует
компенсаторную систему стимулирования, то целевая функция АЭ
полунепрерывна сверху.
123



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Определение индуцированного НОП и максимально недоми-
нируемых альтернатив для задач стимулирования приведено в
работах [35, 41, 44]. Однако, непосредственное использование
максимально недоминируемых альтернатив в задачах стимулиро-
вания затруднительно в силу громоздкости их определения. В
одноэлементных АС с нечеткой внешней неопределенностью на
основании подхода, предложенного С.А. Орловским, использовал-
ся следующий метод решения задач стимулирования: формулиро-
валась задача четкого математического программирования (ЧМП)
и доказывалось, что максимально недоминируемыми альтернати-
вами являются решения этой задачи и только они. Поступим ана-
логичным образом и в рассматриваемой многоэлементной модели.
Для фиксированной обстановки игры можно, по аналогии с
результатами, приведенными в [42, 44], доказать, что в рамках
предположений А.7.4 и А.7.5 четко недоминируемыми альтернати-
вами являются те и только те действия АЭ, функция принадлежно-
сти нечеткого результат деятельности от которых равна единице в
точке максимума целевой функции АЭ. Следовательно, если неко-
торый результат деятельности zi i-го АЭ принадлежит при обста-
z
новке z-i множеству E N (? ) (см. выражение (3)), то множество
четко недоминируемых действий этого АЭ есть Q(z). Вычисляя
объединение по всем точкам Нэша, в силу предположения А.7.4,
получаем выражение (4). •
Теорема 7.2.3. Если выполнены предположения А.7.4–А.7.5, то
система стимулирования
? ci ( zi* , z ?i ) + ? i , zi = zi*
(5) ?i(z , zi) = ? , i ? I,
*

z i ? zi
*
?0,
где
? ci ( z ) },
(6) z* = arg max { min H(y) -
z? A0 y?Q ( z ) i?I
гарантированно ?-оптимальна.
Доказательство. В силу теоремы 4.4.1 система стимулирования
(5) при ?i > 0, i ? I, обеспечивает максимизацию целевой функции
каждого АЭ при (единственном!) результате деятельности zi* при
любой обстановке игры (и минимальных затратах центра на стиму-
124



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
лирование). Из леммы 7.2.1 следует, что множество равновесий
Нэша при этом есть Q(z*). Предположение А.7.5 гарантирует, что
изменением z* ? A0 любой допустимый вектор действий АЭ может
быть сделан точкой Нэша.
При определении гарантированной эффективности системы
стимулирования (5) следует вычислить гарантированный доход
центра: min H(y), то есть взять минимум функции дохода центра
y?Q ( z )
по множеству равновесий Нэша. Оптимальной окажется (результат
решения задачи оптимального согласованного планирования)
система стимулирования, максимизирующая целевую функцию
центра – см. выражение (6). •
Исследуем влияние неопределенности. Сравнивая выражение
(6) с эффективностью max {H(y) - ? ci ( y ) } стимулирования в
y? A' i?I
детерминированном случае (см. раздел 4.4), можно сделать вывод,
что гарантированная эффективность стимулирования в АС с нечет-
кой внешней неопределенностью не выше, чем соответствующих
детерминированных АС (например, за счет вычисления min H(y)
y?Q ( z )
– см. выражение (6)). Очевидно, что с ростом нечеткой неопреде-
ленности (в смысле, определенном в [44]) множество Q(z), по
которому вычисляется минимум, не сужается, следовательно, не
возрастает и гарантированная эффективность стимулирования.
В предельном случае (при переходе к соответствующей де-
терминированной АС) теорема 7.2.3 переходит в теорему 4.4.1. В
том числе, например, когда в рамках предположений А.7.3–А.7.5
нечеткие информационные функции сепарабельны и однопиковые
с точками максимума в действиях АЭ, множества равновесий Нэша
и эффективности в четком и нечетком случаях, очевидно, совпада-
ют.
В заключение настоящей главы отметим, что перспективными
представляются следующие направления исследований многоэле-
ментных АС с неопределенностью. Во-первых, это класс АС, в
которых результат деятельности каждого АЭ зависит от действий
всех АЭ. Во-вторых, исследование условий на информированность
игроков (например, свойства плотности совместного распределе-

125



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
ния состояний природы), при которых можно без потери эффек-
тивности использовать индивидуальные системы стимулирования
и т.д. В третьих, представляет интерес рассмотрение механизмов с
платой за информацию в многоэлементных АС с неопределенно-
стью и асимметричной информированностью.
В целом, из проведенного в настоящей главе анализа много-
элементных АС с неопределенностью можно сделать вывод, что в
тех случаях, когда соответствующие одноэлементные модели
исследованы достаточно полно, и для них получены аналитические
решения, то идея декомпозиции игры АЭ в многоэлементной АС
позволяет достаточно просто получить оптимальное решение
задачи стимулирования. В случае, когда соответствующие одно-
элементные модели исследованы недостаточно подробно (когда,
например, для них не получены даже достаточные условия опти-
мальности простых систем стимулирования), существенно продви-
нуться в изучении их многоэлементных расширений не удается.


8. МОДЕЛИ СТИМУЛИРОВАНИЯ С ГЛОБАЛЬНЫМИ
ОГРАНИЧЕНИЯМИ НА МНОЖЕСТВА
ДОПУСТИМЫХ ДЕЙСТВИЙ АЭ

Рассмотрим АС, состоящую из n АЭ с целевыми функциями
fi(y), i ? I, y = (y1, y2, …, yn). Предположим, что, помимо индивиду-
альных ограничений на множества допустимых стратегий: yi ? Ai,
i?I, существуют глобальные ограничения Aгл на выбор состояний
n
? Ai .
АЭ, то есть y ? A’ ? Aгл, где A’ =
i =1
Можно выделить несколько методов учета глобальных огра-
ничений, то есть методов сведения теоретико-игровых моделей с
глобальными ограничениями на множества допустимых стратегий
игроков к моделям, для которых имеет место гипотеза независимо-
го поведения.
«Метод штрафов». Данный метод заключается в том, что в
случае, когда вектор действий АЭ оказывается вне множества Aгл
(то есть y ? Aгл), целевые функции игроков считаются равными

126



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
минус бесконечности – игроки штрафуются за нарушение ограни-
чений [15, 24, 66]. Далее можно рассматривать игру с «новыми»
целевыми функциями, в которой отсутствуют глобальные ограни-
чения. В зависимости от информированности игроков и того, кто
из игроков нарушает глобальные ограничения, строятся гаранти-
рующие стратегии [24].
«Метод расширения стратегий». В исходной игре все АЭ вы-
бирают свои стратегии одновременно и независимо, не обменива-
ясь информацией с другими игроками1. Можно рассмотреть игру, в
которой каждый из игроков делает предположения о выборе дру-
гих игроков или реакции других игроков на выбор им той или иной
стратегии. В подобных играх используют концепцию П-решения
[15] (см. также Байесовское равновесие, равновесие Штакельберга
и др. [56, 66]), которая включает в себя максиминные равновесия,
равновесия Нэша и ряд других как частные случаи, и заключается в
следующем.
Пусть все активные элементы, за исключением i-го, выбрали
свои стратегии y-i ? A-i. Введем множества: Ai(y-i) = {yi ? Ai | y ? A’
? Aгл}, i ? I, Ai(y-i) – множество стратегий i-го АЭ, при которых
вектор действий удовлетворяет глобальным ограничениям2. Пред-
положим, что i-ый АЭ делает предположение ?i(yi) ? A-i о множе-
стве возможных «реакций» остальных АЭ на выбор им стратегии
yi?Ai, i ? I. Тогда, например, рациональным можно считать пове-
дение игроков, заключающееся в стремлении к максимизации
I Ai(y-i)
выбором собственной стратегии из множества
y ?i??i ( yi )
гарантированного по множеству ?i(yi) значения своей целевой
функции, то есть
yiп = arg fi(y), i ? I.
max min
Ai ( y ?i ) y ?i ??i ( yi )
yi ? I
y ?i ??i ( yi )

Возможны и другие определения рациональности поведения
1
Возможность и целесообразность обмена информацией (информацион-
ное расширение игры) в играх с запрещенными ситуациями рассматрива-
лась в работе [24].
2
В общем случае нельзя исключать из рассмотрения следующие ситуа-
ции: ? i ? I, ? y-i ? A-i: Ai(y-i)=?.
127



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
игроков, например: введем множества Y?гi (yi) = Arg min fi(y),
y ?i??i ( yi )
˜
Ai(y-i), yiп = arg max fi(y), i ? I, и т.д.
I
Ai = min
˜
y ?i ??i ( yi )
yi?Ai
г
y ?i?Y?i ( yi )
Если предположения всех АЭ оправдываются, то есть ? i ? I
п
? ?i( yiп ), то ситуацию игры y? ? A’ ? Aгл называют П-
y ?i
равновесием.
Существует несколько частных случаев, в которых учет гло-
бальных ограничений производится «автоматически». Если у
каждого из игроков имеется доминантная стратегия (или в игре
существует единственное равновесие Нэша) и игра характеризует-
ся полной информированностью, то каждый из игроков может
вычислить доминантные стратегии всех остальных игроков (соот-
ветственно – точку Нэша). Если при этом вектор доминантных
стратегий (или точка Нэша) удовлетворяют глобальным ограниче-
ниям, то проблем их учета не возникает.
Отметим, что метод расширения стратегий, во-первых, требует
от исследователя операций введения трудно обосновываемых
предположений о принципах поведения игроков, а, во-вторых, не
всегда П-решение оказывается П-равновесием, или, вообще, суще-
ствует.
Если в методе штрафов и в методе расширения стратегий ни-
как не оговаривалось наличие управления со стороны центра, то
следующие два метода учета глобальных ограничений существен-
но используют управляющие возможности центра.
«Метод согласования». Основная идея метода согласования
заключается в следующем (см. также двухшаговый метод решения
вероятностных [58] и др. задач стимулирования и метод согласо-
ванного планирования [15]). На первом шаге решения задачи
управления (стимулирования) центр для каждого вектора действий,
принадлежащего множеству A’ (без учета глобальных ограниче-
ний) ищет допустимое управление, при котором данный вектор
действий принадлежит множеству решений игры активных эле-
ментов. Результатом первого шага, например, в задаче стимулиро-
вания, является множество AM действий АЭ, реализуемых при
данных ограничениях M на систему стимулирования, AM ? A’.
128



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Затем на втором шаге центр ищет множество A* действий АЭ,
которые, во-первых, реализуемы, во-вторых, удовлетворяют задан-
ным глобальным ограничениям Aгл, и на которых достигается
максимум его целевой функции. Итак, на втором шаге центр реша-
ет следующую задачу:
(1) A* = Arg max ?(y).
y ? AM ? Aгл
Максимальная эффективность управления при этом равна
?(y ), где y* - произвольный элемент множества A*.
*

«Метод изменения порядка функционирования». Выше пред-
полагалось, что АЭ выбирают, при известной стратегии центра,
свои действия одновременно и независимо. Если центр как метаиг-
рок может изменить порядок функционирования, то есть последо-
вательность получения информации и выбора стратегий активны-
ми элементами, то, варьируя последовательность выбора стратегий
АЭ, можно существенно упростить задачу учета глобальных огра-
ничений. Если существует нумерация АЭ, такая что Ai = Ai(y1, y2,
…, yi-1), то каждый АЭ должен при выборе своей стратегии учиты-
вать ограничения, наложенные совместно глобальным ограничени-
ем и уже выбранными к настоящему моменту стратегиями АЭ с
меньшими номерами.
Например, допустимой с рассматриваемой точки зрения явля-
ется последовательность функционирования АС, имеющая вид
сетевого графика (без контуров). Частным случаем является после-
довательный выбор стратегий активными элементами – так назы-

<<

стр. 4
(всего 6)

СОДЕРЖАНИЕ

>>