<<

стр. 2
(всего 5)

СОДЕРЖАНИЕ

>>

j =1
ется лишь во взятии максимумов. Таким образом, декомпозиция исход-
ной задачи и последующий синтез частных задач в рассмотренной модели
не привели в отсутствии агрегирования информации к увеличению эф-
фективности управления. Справедливости ради следует отметить, что
агрегирования в чистом виде в моделях настоящего раздела нет – имеется
лишь декомпозиция задач, в которых центр обладает об активных эле-
ментах в точности той же информацией, что и центры промежуточного
уровня. Это, в частности, позволяет говорить о совпадении K3 и K4 в
рассматриваемой модели, то есть при отсутствии агрегирования инфор-
мации (полной информированности всех участников о точных моделях
элементов всех уровней) возможно, что декомпозиция задачи управления
и не приведет к снижению эффективности.
Перейдем к анализу задач стимулирования в многоуровневых АС с
агрегированием информации.


1.3. СТИМУЛИРОВАНИЕ В МНОГОУРОВНЕВЫХ
АКТИВНЫХ СИСТЕМАХ С АГРЕГИРОВАНИЕМ
ИНФОРМАЦИИ

В разделе 1.1 была приведена общая постановка детерминированной
задачи стимулирования в трехуровневой активной системе, то есть в
такой АС, в которой результаты деятельности участников не зависят от
случайных и неопределенных параметров. Отметим, что детерминиро-
ванность в таком понимании не противоречит возможности агрегирова-
ния по состоянию и по модели. Прежде чем переходить к их теоретиче-
скому анализу, рассмотрим пример, иллюстрирующий роль
агрегирования информации в иерархических АС.

37
nj n
? yij , H(Y) = ? ?
2
j
Yj, cij(yij) =
Пример 1.3.1. Пусть Y = y ij /2?ij.
i =1 j =1
Предположим, что и агрегирование, и экономический фактор отсутству-
ют, то есть центр полностью информирован о параметрах АЭ, наблюдает
все их действия и Hj(yj) ? 0. Тогда рассматриваемая трехуровневая АС
имеет свой двухуровневый аналог (см. определение выше), в котором в
рамках А.4 (отсутствие ограничений на стимулирование) центр решает
следующую задачу стимулирования:
nj
n
? ? {?yij ? cij ( y ij )} > max
{y }
i =1
j =1 ij

*
= ? ?ij. При этом эффективность
y ij
и находит оптимальное решение
nj
n
? ? ? ij .
стимулирования равна K0 = ? ?/2, где ? = 2

i =1
j =1
Если фонд заработной платы ограничен величиной c (см. А.4''), то,
2c
*
y ij (c) = ?ij
решая задачу условной оптимизации, получаем, что ,а
?
эффективность – K1(c) = ? 2c? – c. Максимум K1 (c) по c ? 0 достига-
ется при c = c max = ?2 ? /2 (для проверки можно убедиться, что
K1(cmax) = K0).
Введем теперь агрегирование без учета экономического фактора
(Hj(yj) ? 0). Задача центра состоит в назначении подсистемам согласован-
ных планов {Xj}, максимизирующих его целевую функцию20:
n n
? ?
(1.3.1) ? cj(Xj) >
j
max ,
X– j
j =1 j =1 {X }

?c j ( X j ), Y j = X j
(1.3.2) ?j(X ,Y ) = ?
j j
.
?Xj
j
?0, Y
Условие (1.3.2) обеспечивает согласованность назначаемых актив-
ным элементам планов [9,21-23].
Задача Цj заключается в назначении согласованных планов АЭ своей
подсистемы при известном стимулировании (1.3.2):

20
Системы стимулирования вида (1.3.2), (1.3.4) называются квазикомпенсатор-
ными (QK-типа) [24,81].
38
(1.3.3) ?j(Xj,Yj) – cj(Yj) > max ,
{ y ij}

? cij ( x ij ), y ij = x ij
?
(1.3.4) ?ij(xij,yij) = ? ,
y ij ? x ij
?0,
?
nj
? xij = Xj.
(1.3.5) Qj(xj) =
i =1
Условие согласованности моделей (1.1.5) для данного случая примет
вид:
nj
nj nj
? yij
(1.3.6) cj(Y ) = cj( ? y ij ):= { ? cij ( y ij ) |
j
= Yj}.
i =1 i =1 i =1
Остановимся на выражении (1.3.6) более подробно. Важнейшим для
нашего анализа ее свойством является то, что при агрегировании по
состоянию и по модели набор действий АЭ некоторой подсистемы,
приводящий к фиксированному значению агрегата деятельности этой
подсистемы, не единственен. Другими словами, существует несколько
nj
? cij ( yij )
j
(быть может континуум) затрат cj(Y ), согласованных с при
i =1
nj
? yij = Yj. Эта неоднозначность есть результат агрегирования
условии
i =1
(в рассматриваемом примере суммирование не является взаимно одно-
значным преобразованием).
Предположим, что затраты (1.3.6) определяются в результате реше-
ния следующей задачи:
? nj
?? cij ( y ij ) > min
? { yij }
(1.3.7) ? i =1 ,
nj
? ?y = X j
? i =1 ij
?
то есть из всех отображений, удовлетворяющих (1.3.6), выбирается то, на
котором достигается минимум суммарных затрат j-ой подсистемы на
выполнение плана Xj.



39
2 *
y ij /2?ij решение (1.3.7) имеет вид y ij (Xj) = ?ij Xj / ?j, где
При cij(yij) =
nj
? ? ij . Получаем, что затраты j-ой подсистемы должны удовлетво-
?j =
i =1
рять
2
(Y j )
(1.3.8) cj(Yj) = .
2? j
Решая теперь задачу центра (1.3.1), получаем оптимальное распреде-
ление фондов стимулирования между подсистемами:
(1.3.9) Xj * = ? ?j.
*
y ij (Xj) = ?ij Xj */ ?j = ? ?ij, что совпадает с ре-
Заметим, что при этом
шением задачи стимулирования в двухуровневой АС с теми же АЭ и
обеспечивает эффективность K0 = ?2? / 2.
Если суммарный фонд заработной платы (ФЗП) ограничен величи-
ной c, то, используя (1.3.8)-(1.3.9), получаем оптимальное распределение
ФЗП между подсистемами: Cj = c ?j / ?, что обеспечивает эффективность
стимулирования K1 = ? 2c? – c, в точности совпадающую с величи-
ной K1(c), полученной выше для двухуровневой АС.
Таким образом, доопределение затрат подсистем с помощью (1.3.7)
позволило получить в трехуровневой АС в точности ту же эффективность
стимулирования, что и в соответствующей двухуровневой, то есть введе-
ние дополнительных уровней управления и агрегирования информации
не снизило эффективность управления. Этот факт представляет значи-
тельный интерес, так как введение агрегирования без учета информаци-
онного фактора в общем случае не увеличивает эффективности. Если
эффективность управления в трехуровневой АС с агрегированием ин-
формации равна эффективности управления в соответствующей двух-
уровневой АС с полной информированностью центра о моделях поведе-
ния АЭ и подсистем, то агрегирование назовем идеальным. Следует
отметить, что такое определение идеального агрегирования ставит во
главу угла эффективность управления, а не передаваемую информацию,
соотношение ее объемов и т.д.
В рассматриваемом примере идеальность агрегирования обеспечи-
валась условием (1.3.7). Покажем, что, если определить затраты подсис-
тем другим образом, отличным от (1.3.7), но согласованным с (1.3.6), то
эффективность стимулирования может только уменьшиться. Для иллюст-

40
рации возьмем предельный случай – предположим, что затраты (1.3.6)
определяются в результате решения следующей задачи:
? nj
?? cij ( y ij ) > max
? { yij}
(1.3.10) ? i =1 ,
nj
? ?y = X j
? i =1 ij
?
то есть из всех отображений, удовлетворяющих (1.3.6), выбирается то, на
котором достигается максимум суммарных затрат j-ой подсистемы на
выполнение плана Xj. Решение (1.3.10) содержательно соответствует
выполнению всего плана Xj тем АЭ j-ой подсистемы, который имеет
?j
min
min ?ij, получим:
максимальные затраты. Обозначив =
i =1,n j
2
( X j)
(1.3.11) cj(Xj) = .
2? min
j
Решая задачу (1.3.1), находим оптимальные значения планов подсис-
тем:
?j ,
min
(1.3.12) Xj * = ?
n
что приводит к эффективности K2 = ? /2 ? ? j . Сравнивая K2 с
min
2

j =1
n
K0 = ? /2 ? ?j получаем, что K2 ? K0. Отношение ? = K2 / K0 можно
2

j =1
рассматривать как относительные потери эффективности, связанные с
неидеальностью агрегирования. Если все АЭ одинаковы (такие АС назы-
ваются однородными), то, очевидно, имеет место:
(1.3.13) ? = n / N.
Содержательно, из (1.3.13) следует, что "потери агрегирования" уве-
личиваются с ростом числа АЭ в системе и уменьшаются с ростом числа
промежуточных центров. Последний эффект особенно ярко проявляется в
предельном случае – если число промежуточных центров равно числу АЭ
(тривиальная трехуровневая АС), то потери агрегирования отсутствуют
(потому что в данном случае нет и самого агрегирования). •
Закончив рассмотрение примера, перейдем к анализу общего случая.
Определим для произвольного Yj ? Aj множество:
(1.3.14) Aj(Yj) = {yj ? Aj | Qj (yj) = Yj}.
41
min
y ij ( Yj ) – решение следующей задачи:
Пусть
nj
? cij ( y ij ) > min
(1.3.15) ,
y j? A j (Y j )
i =1
max
yij (Yj) – решение следующей задачи:
а
nj
? cij ( y ij ) > max
(1.3.16) .
y j?A j (Y j )
i =1
nj nj
? cij ( y ij (Y j )) , c j (Y ) = ? cij ( y ij (Y j )) .
min max
(Yj) = j
Обозначим min
c max
j
i =1 i =1
min max
j j
Очевидно, что c j (Y ) и c j (Y ) удовлетворяют (1.1.5), то есть ре-
альная модель промежуточного центра и представления о ней центра
согласованы. Более того, очевидно, что ? Y ? A любая функция затрат
промежуточного центра (при условии реализации используемыми систе-
мами стимулирования соответствующих действий в подсистемах – см.
раздел 1.2) cj(Yj) удовлетворяет:
min max
(Yj) ? cj(Yj) ? (Yj).
cj cj
(1.3.17)
min
(Yj) промежуточного центра
Агрегированная функция затрат cj
минимизирует его затраты на стимулирование по реализации агрегата Yj и
соответствует идеальному агрегированию. Определяемый (1.3.17) диапа-
зон изменений агрегированной функции затрат отражает характерную для
многоуровневых систем неполноту информированности центра о моделях
активных элементов. Таким образом, обоснована справедливость сле-
дующих утверждений.
Теорема 1.3.1. Если выполнены предположения А.1 и А.4, то в рам-
ках ГБ максимальная гарантированная (по множеству согласованных
моделей подсистем) эффективность стимулирования в трехуровневой АС
равна
n
? cj
max
max
(Yj)].
max [H(Y) –
(1.3.18) =
K g
Y ?A j =1
Теорема 1.3.2. Если выполнены предположения А.1 и А.4, то в рам-
ках ГБ максимальная эффективность стимулирования в трехуровневой
АС соответствует полной информированности центра о моделях АЭ и
равна

42
n
? cj
min
max
(Yj)].
max [H(Y) –
(1.3.19) K =
Y ?A j =1
Следствие 1.3.3.
а) Идеальное агрегирование имеет место, если агрегированная функ-
min
(Yj).
ция затрат промежуточного центра равна cj
б) Без учета информационного фактора агрегирование информации в
задачах стимулирования в многоуровневых АС не увеличивает эффек-
тивности стимулирования.
Выражения (1.3.18) и (1.3.19) дают, соответственно, нижнюю и
верхнюю оценки эффективности стимулирования в рассматриваемой
трехуровневой активной системе: K max ? K ? Kmax. Таким образом, для
g
достижения максимальной эффективности стимулирования Kmax центр
должен либо полностью знать модели поведения АЭ и промежуточных
центров для того, чтобы обеспечить выполнение (1.3.15) (что лишает
агрегирование смысла), либо добиваться выполнения (1.3.15) какими-
либо другими доступными ему способами.
Пусть, например, значение агрегированной функции затрат проме-
жуточного центра есть c min (Yj), но неизвестно точно центру. Если центр
j
будет использовать механизм с сообщением информации, основываю-
щийся на сообщениях промежуточных центров, то максимальная эффек-
тивность достигнута не будет. Действительно, промежуточные центры
могут сообщать центру любые оценки затрат, удовлетворяющие (1.3.17)
(уличить их в искажении информации при этом невозможно). Тогда
оптимальной стратегией каждого из независимых промежуточных цен-
max
(Yj), так как стимулиро-
тров будет сообщение максимальных затрат cj
вание центра основано на компенсации затрат и при таком сообщении
значение целевой функции промежуточного центра максимально. Следо-
вательно, возникает новый класс задач – задач анализа и синтеза меха-
низмов с сообщением информации в многоуровневых АС.
Вторым классом задач, возникающих в многоуровневых АС с агре-
гированием информации является задача оптимального агрегирования
(см. введение), то есть – задача выбора агрегатов, минимизирующих
различие между максимальной гарантированной и максимальной эффек-
тивностями.
И, наконец, третьим классом новых задач являются задачи синтеза
структуры АС – выбора оптимального числа промежуточных центров,

43
решение задач о назначении (разбиения множества АЭ на подсистемы) и
т.д. (в рассмотренном выше примере 1.3.1 мы видели как относительные
потери в эффективности зависят от числа промежуточных центров и
числа АЭ (см. 1.3.13)). Детальное изучение механизмов такого рода
выходит за рамки настоящей работы и является задачей будущих иссле-
дований.

1.4. СТИМУЛИРОВАНИЕ В МНОГОУРОВНЕВЫХ
АКТИВНЫХ СИСТЕМАХ, ФУНКЦИОНИРУЮЩИХ В
УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

До сих пор мы рассматривали детерминированные активные систе-
мы, в которых участники обладали в рамках информированности, соот-
ветствующей той или иной модели, полной и точной информацией о
существенных внутренних и внешних по отношению к системе парамет-
рах. Расширением базовой детерминированной модели являются актив-
ные системы с неопределенностью [81]. Достаточно общим (для различ-
ных типов и видов неопределенности) является вывод о том, что с ростом
неопределенности гарантированная эффективность стимулирования не
возрастает [81]. Более того, для ряда моделей двухуровневых АС было
показано [20,78,81], что обмен информацией между АЭ нижнего уровня и
между АЭ и центром иногда позволяет снизить неопределенность и
увеличить эффективность управления. Поэтому в настоящем разделе в
основном на примере нечеткой внешней неопределенности (см. детальное
описание модели в [79,81]) изучается "фактор неопределенности" (кор-
ректней было бы назвать его "фактор снижения неопределенности" или
"фактор изменения информированности"), заключающийся в потенци-
ально взаимовыгодном обмене информацией между участниками трех-
уровневой АС, приводящем к увеличению эффективности управления.
Рассмотрим двухуровневую многоэлементную активную систему,
функционирующую в условиях нечеткой внешней неопределенности при
симметричной информированности участников [79,81]. Результат дея-
тельности ij-го АЭ zij ? Aij в общем случае зависит от его действия и от
состояния природы, о котором имеется нечеткая информация. Предполо-
жим, что и центр, и АЭ на момент принятия решений обладают одинако-
вой информацией о функции принадлежности результата деятельности
АЭ в зависимости от его действия: P ij(zij, yij). Целевая функция АЭ
˜
зависит от результата его деятельности:
(1.4.1) fij(zij) = ?ij(zij) – cij(zij),
44
а целевая функция центра есть
(1.4.2) ?(y) = H(y),
то есть, в отличие от моделей, рассматриваемых в предыдущих разделах,
будем считать, что целевые функции всех АЭ зависят от результатов их
деятельности. Пусть ?ij±(xij) = max (min) {zij ? Aij | P ij(zij, xij) = 1}. Введем
˜
следующие предположения.
А5. Функции P ij(zij, yij) 1-нормальны [79,81,84].
˜
А6. ? x1 ? x2 ?ij-(x1) ? ?ij-(x2), ?ij+(x1) ? ?ij+(x2).
Для выполнения А6, например, достаточно, чтобы результат дея-
тельности АЭ аддитивно зависел от его действия и нечеткого состояния
природы.
Определим множества
(1.4.3) Sij(xij) = {yij ? Aij | P ij(xij, yij) = 1}, S(x) = ? S ij ( x ij ) , A' = ? Aij .
˜ i, j i, j
В [79] доказано, что гарантированная эффективность стимулирова-
ния определяется следующим образом:
(1.4.4) Kg0 = max min ?(y).
x? A y?S ( x )
Из [81] известно, что гарантированная эффективность стимулирова-
ния в АС с внешней нечеткой неопределенностью не выше, чем в соот-
ветствующей детерминированной АС и не возрастает с ростом неопреде-
ленности. Поэтому, если объединение отдельных АЭ в систему
увеличивает их информированность (в частности такое увеличение ин-
формированности может происходить за счет дополнительной обработки
информации центром или центрами промежуточного уровня), то оно
может приводить и к росту эффективности управления, при условии, что
информационные возможности управляющих органов достаточны, на-
пример, если информация может быть переработана ими в реальном
масштабе времени. Объединение нечеткой информации АЭ соответствует
пересечению соответствующих информационных множеств – например:
(1.4.5) P (z, y) = I P ij(z, y) = min { P ij(z, y)}.
˜ ˜ ˜
i, j
i, j

Если выполнено А5 и А6, то (1.4.5) эквивалентно: ?–(x) = max {?-
i, j

?+(x) = min {?+ij(x)}. Рассмотрим пример, иллюстрирующий
ij(x)},
i, j
целесообразность информационного взаимодействия участников.

45
nj
n
? ?? ij yij ,
2
y ij /2?ij; ?-
Пример 1.4.1. Пусть H(y) = cij(yij) =
i =1
j =1
= xij – ? ij(x), ?+ij ?+ij(x)
– xij – не зависят от xij и ?-ij = ?+ij = ?ij, причем
-
=
ij
2?ij ? ?ij ?ij. Если 0??ij?Сij, то множество реализуемых действий АЭij есть
nj
n
??
2 C ij ? ij ], а эффективность равна
Pij = [0; K0 = {?i
i =1
j =1

2 C ij ? ij – ?ij ?ij}.
Если возможен обмен информацией, то эффективность будет равна:
nj nj
n n
?? ? ? ? ij .
2 C ij ? ij – min {?ij}
?ij
'=
K0
i, j
i =1 i =1
j =1 j =1
Отметим, что такой обмен информацией выгоден всем участникам
АС: реальная полезность АЭ не изменится, а полезность центра не
уменьшится.
Очевидно, K0' ? K0, причем, если хотя бы один АЭ имеет четкую и
достоверную информацию о состоянии природы, то второе слагаемое в
выражении для K0' равно нулю (первое слагаемое соответствует эффек-
тивности стимулирования в соответствующей детерминированной АС).•
Таким образом, результат сравнения эффективностей управления в
случаях различной информированности участников АС является косвен-
ной оценкой затрат на преобразование, передачу и обработку информа-
ции, то есть оценкой влияния фактора неопределенности. Следует отме-
тить, что на сегодняшний день достаточно полно разработаны методы
решения задач стимулирования в двухуровневых АС, функционирующих
в условиях неопределенности (интервальной, вероятностной и нечеткой)
при симметричной и асимметричной информированности участников
[19,20,78,81]. В указанных работах проведен анализ и приведены оценки
влияния неопределенности на эффективность управления. Там же пред-
ложено рассматривать разность эффективностей управления при различ-
ной информированности как стоимость соответствующей информации.
Перенос известных результатов такого рода с двухуровневых на много-
уровневые АС представляется достаточно перспективным. При этом
необходимо учитывать, что даже в рамках одинаковой информированно-
сти возможно возникновение ошибок принятия решений за счет субъек-
тивных различий оценок имеющейся информации [91].
Выше была рассмотрена модель двухуровневой АС, функциони-
рующей в условиях нечеткой внешней неопределенности. При этом
46
оказалось, что объединение информации участников позволяет увеличить
эффективность управления. Относительно трехуровневых АС с нечеткой
неопределенностью следует отметить, что объединение нечеткой инфор-
мации (1.4.5) является полностью децентрализуемой операцией в сле-
дующем смысле: АС может быть разбита произвольным образом на
подсистемы, затем пересечение информационных множеств P ij(z, y)
˜
может быть вычислено внутри подсистем, после чего – между подсисте-
мами.
Тем же свойством полной децентрализуемости обладают операции
объединения информации и в многоуровневых АС, функционирующих в
условиях внешней интервальной неопределенности при условии, что
участники АС обладают согласованной информацией. Поясним это
утверждение более подробно. Пусть результат деятельности АЭij
zij = yij + ?. Предположим, что АЭij достоверно знает, что
? ? ?ij = [dij; Dij]. Тогда объединение информированности участников
означает определение множества ? = [d; D] = I ?ij ? ?ij, где
i, j

max {dij}, D = min {Dij}, то есть количество информации увеличи-
d=
i, j
i, j
вается. Понятно, что пересечение множеств ?ij можно вычислять в произ-
вольной последовательности, в частности – сначала внутри подсистем:
?j = I ?ij, а затем – между подсистемами: ? = I ?j. Существенной
i j
при этом является согласованность информации АЭ, которая гарантирует,
что ? ? ?, то есть d ? D.
Полученный в [77] результат об оптимальном управлении в услови-
ях симметричной информированности о внешней неопределенности –
"теорема о стукаче" – также может быть обобщен на случай
многоуровневых АС, так как рассмотренная в упомянутой работе модель
полностью децентрализуема в оговоренном выше смысле.
Содержательно, оптимальной стратегией центра и/или промежуточного
центра является назначение в метасистеме/подсистеме диктатора
("стукача"), который будет сообщать информацию о внешних условиях
функционирования и поощряться независимо от результатов его
деятельности. Вся известная диктатору и сообщенная им достоверно (в
силу независимости вознаграждения от сообщения) информация
используется центром для синтеза оптимального механизма управления
остальными АЭ. Интересно отметить, что диктатором следует назначать
участника, эффективность деятельности которого минимальна, то есть
тот АЭ/промежуточный центр, бездеятельность которого приводит 47 к
ность которого приводит к наименьшему снижению критерия эффектив-
ности функционирования системы/подсистемы.
В случае вероятностной неопределенности снижение неопределен-
ности за счет децентрализуемости информации не столь очевидно. Пусть,
например, внешняя неопределенность приводит к следующей зависимо-
сти результата деятельности от действия АЭ: zij = yij + ?ij, где ?ij –
состояние природы – внешний для АЭij фактор. Пусть {?ij} –
независимые одинаково распределенные случайные величины, а
nj
? zij = Yj + ? j, где
j
показатель деятельности j-ой подсистемы Z =
i =1
nj nj
? ?
yij, ? = ?ij. Тогда, если число АЭ в подсистеме достаточно
j j
Y=
i =1 i =1
велико, то агрегирование информации автоматически приводит к
снижению неопределенности: центру, например, не обязательно знать
распределения случайных величин, а достаточно (при заданном уровне
риска) воспользоваться законом больших чисел.
Активные системы с большим числом участников обладают рядом
специфических свойств (см. обзор [78] и ссылки в нем). Помимо отме-
ченной выше возможности "автоматического усреднения" результатов
деятельности АЭ, следует упомянуть также результаты, требующие
выполнения гипотезы слабого влияния (см. [22,28,75,109], а также раздел
2.5 настоящей работы), степень "выполнения" которой, естественно,
зависит от числа участников АС.
В случае вероятностной неопределенности в иерархических АС име-
ет место также эффект страхования. Если имеется набор несклонных к
риску АЭ, то даже взаимное страхование (выделение одного АЭ с той же
несклонностью к риску, который будет выполнять роль страховщика)
является взаимовыгодным [90]. Еще более выгодным для АЭ с точки
зрения ожидаемой полезности является перераспределение риска с ней-
тральным к риску центром (см. подробное обсуждение теоретико-
игровых моделей страхования в рамках теории активных систем в
[25,27,58], а также раздел 2.6 настоящей работы, посвященный децентра-
лизации механизмов страхования).
Для центров промежуточного уровня имеет смысл перераспределе-
ние риска с центром верхнего уровня – эффект перестрахования (см.
раздел 2.6) и т.д. Поэтому с одной стороны страхование может рассмат-



48
риваться как системообразующий фактор21 (см. раздел 1.5 и модели
трудовых и страховых контрактов в [19]), а с другой – как одна из состав-
ляющих фактора неопределенности.


1.5. СТИМУЛИРОВАНИЕ КАК СИСТЕМООБРАЗУЮЩИЙ
ФАКТОР

Если в предыдущих разделах при анализе качественных отличий
многоуровневых активных систем от двухуровневых мы стояли на пози-
циях оперирующей стороны – центра (исследовали, фактически, "зачем
центру нужны промежуточные уровни управления"), интересуясь, в
основном, эффективностью управления (которая определялась значением
целевой функции именно центра), то в настоящем разделе мы рассмотрим
иерархию с точки зрения активных элементов нижнего уровня. Другими
словами, попытаемся ответить на вопрос – "зачем АЭ нужны более высо-
кие уровни иерархии (промежуточные центры, центр и т.д.)?"
Ответ на поставленный вопрос будет производиться в два этапа, ре-
зультаты выполнения каждого из которых представляют самостоятель-
ный интерес. На первом этапе изучается одноуровневая АС – набор
"равноправных" активных элементов, ни один из которых не является
метаигроком по отношению к другим элементам. В качестве альтернати-
вы одноуровневой системе, рассматривается двухуровневая система,
отличающаяся от исходной выделением над множеством АЭ управляю-
щего органа – центра, наделяемого властью, понимаемой в контексте
рассматриваемой модели как право первоочередного (в последовательно-
сти выбора стратегий) принятия решений, неизбежно затрагивающих
интересы АЭ. Исследование взаимодействия активных элементов и
центра подразумевает анализ задачи стимулирования в двухуровневой
АС с сильно связанными АЭ (см. определение выше). Таким образом, на
первом этапе решается определенный класс новых задач стимулирования
в двухуровневых АС. На втором этапе – собственно изучения выгодности
для АЭ введения управляющего органа – проявляется "многоуровне-
вость", так как результаты первого этапа (решения задачи стимулирова-
ния) позволяют сравнить эффективности функционирования АЭ в отсут-
ствии центра и в его присутствии.

21
Стимулирование в вероятностных активных системах также может рас-
сматриваться как одно из проявлений перераспределения риска, то есть страхо-
вания (см. [19,25 и др.]).
49
Рассмотрим одноуровневую активную систему, состоящую из N ак-
тивных элементов. Стратегией каждого АЭ является выбор действия
yi ? Ai, i ? I = {1, 2, ..., N}. Целевая функция (функция полезности, выиг-
рыша, предпочтения и т.д.) каждого АЭ hi зависит от действий всех АЭ,
N
? Ai , hi: A' > ?1. Предпо-
то есть hi = hi(y), где y = (y1, y2, ..., yN) ? A' =
i =1
ложим, что АЭ полностью информированы друг о друге (каждому из-
вестны все целевые функции и допустимые множества), но вынуждены
действовать независимо, не делая предположений о поведении других АЭ
(этим предположением мы исключаем из рассмотрения: кооперативные
эффекты – возможности образования коалиций и т.д., а также эффекты
рефлексии, используемые при определении Байесовского равновесия,
равновесия Штакельберга, П-решения и др. [22,108,117]). Тогда, в соот-
ветствии с гипотезой рационального поведения, каждый АЭ будет выби-
рать собственную стратегию, максимизирующую его целевую функцию.
Основная "проблема" теории игр заключается в том, что эта стратегия не
единственна и зависит от обстановки (вектора стратегий остальных
игроков – АЭ). Следовательно, необходимо введение понятия равновесия,
а иногда и его доопределение для конкретной игры.
Если оптимальная стратегия каждого из игроков не зависит от об-
становки, то имеет место равновесие в доминантных стратегиях (РДС):
yd – РДС тогда и только тогда, когда
d
(1.5.1) ? i ? I ? y-i ? A'-i ? yi ? Ai hi( y i ,y-i) ? hi(yi,y-i).
К сожалению РДС существует достаточно редко, поэтому в некоопе-
ративных играх чаще используется концепция равновесия Нэша (РН): yN –
РН тогда и только тогда, когда
N N N
(1.5.2) ? i ? I ? yi ? Ai hi( y i , y ?i ) ? hi(yi, y ?i ).
Введем на множестве A' отношение " f ": y1 f y2 - ? i ? I
hi(y1) ? hi(y2) и ? j ? I: hj(y1) > hj(y2). Определим множество Парето опти-
мальных (эффективных) стратегий22:
(1.5.3) EP(h) = {y ? A' | ¬? t ? A': t f y}.
22
Отметим, что на сегодняшний день не существует общепризнанного опреде-
ления коллективной рациональности. В то же время, в экономике, в математи-
ческой теории управления социально-экономическими системами и др., сущест-
вует консенсус относительно того, что любое определение коллективной
рациональности должно быть согласовано с аксиомой Парето (аксиомой едино-
гласия), то есть считается, что коллективно рациональными могут быть
только Парето оптимальные исходы [45,52,73,87].
50
Обозначим Ed(h) – множество РДС, EN(h) – множество РН, ENP(h)
множество равновесий Нэша, которые не доминируются по Парето дру-
гими равновесиями Нэша, EPN(h) – множество тех Парето оптимальных
стратегий, которые являются равновесиями Нэша.
Вопрос о том, какой вектор стратегий выберут АЭ, производя этот
выбор в условиях полной информированности о целевых функциях и
допустимых множествах друг друга одновременно, без предварительных
договоренностей, в общем случае остается открытым. Если существует
РДС, то логично предположить, что АЭ выберут именно доминантные
стратегии. Если РДС не существует, то в качестве состояния системы
обычно принимается равновесие Нэша. Если таких РН несколько и среди
них существует РН, недоминируемое по Парето другими РН, то, считают,
что, скорее всего система окажется в ENP(h). Если же все РН не домини-
руют друг друга, то сказать априори, без введения дополнительных
предположений, ничего нельзя. В общем случае, всегда выполнено:
Ed(h) ? EN(h), ENP(h) ? EN(h), но может оказаться, что ENP(h) ? EP(h) = ?
или даже Ed(h) ? EP(h) = ?.
Содержательно, концепции равновесия в доминантных стратегиях и
равновесия Нэша отражают индивидуальную рациональность поведения
активных элементов. В первом случае – независимо от обстановки суще-
ствует оптимальная стратегия, во втором – индивидуальное отклонение
любого АЭ от РН невыгодно ему, если все остальные АЭ не отклоняются
от РН. К сожалению, во многих случаях индивидуальная рациональность
входит в противоречие с коллективной рациональностью (очень условно
отражаемой аксиомой Парето). Противоречие следующее – с одной
стороны, набор индивидуально рациональных стратегий (например, РДС,
РН и т.д.) может доминироваться другим набором стратегий (при котором
все АЭ получают не меньшие выигрыши, а кто-то – строго большие). С
другой стороны, коллективно рациональных стратегии (множество Паре-
то оптимальных стратегий) может быть несколько, они могут быть неус-
тойчивы относительно индивидуальных отклонений АЭ (может найтись
АЭ, который один, изменяя свою стратегию, еще более увеличивает свой
выигрыш, естественно, за счет других игроков).
Соотношение индивидуальной и коллективной рациональности яв-
ляется одной из ключевых проблем теории игр (см. примеры и ссылки в
[73,74,78]). Интуитивно ясно, что если существует лучшая для всех АЭ
(по сравнению с индивидуально рациональным) линия поведения (при
условии, что коалиции, переговоры и т.д. запрещены), то следует вырабо-
тать процедуру (механизм) наказания тех АЭ, которые будут от нее
отклоняться.
51
Следует отметить, что механизм наказания является "внешним" по
отношению к активным элементам и зачастую либо навязывается им
извне, например, центром, либо является предметом их договоренности
(расширение игры). Если последовательно разыгрывается несколько
партий игры, то, изменяя свои стратегии, АЭ могут в текущем и будущих
периодах наказать участника, отклонившегося в предыдущем периоде.
Задачи построения таких стратегий решаются в теории повторяющихся
игр (см., например, обзор [78] и ссылки в нем). Сложнее дело обстоит в
статике – при разыгрывании одной единственной партии игры, так как в
этом случае угроза будущего наказания со стороны партнеров бессмыс-
ленна23.
Угроза наказания приобретает смысл в статике, если имеется третье
(по отношению к АЭ) лицо, наделенное соответствующими властными
полномочиями, например – центр. Налагая штрафы, он может сделать
невыгодным индивидуальное отклонение от коллективного оптимума, то
есть сделать Парето оптимальную стратегию устойчивой по Нэшу. Это –
первое, что может предложить центр АЭ, причем ниже будет показана
выгодность этого для АЭ с точки зрения значений их функций выигрыша
(экономический фактор с точки зрения АЭ). Второй эффект от введения
центра заключается в снижении объема информации, перерабатываемой
АЭ. Действительно, для "вычисления", например, РН каждый из АЭ
должен знать целевые функции и допустимые множества всех АЭ с тем,
чтобы, опять же, каждый из них мог независимо решить систему нера-
венств (1.5.2). При введении центра, последнему достаточно, обладая
информацией о каждом из АЭ (информированность АЭ друг о друге уже
не нужна), вычислить все равновесия, разработать систему наказания и
дать соответствующую информацию активным элементам, уменьшив тем
самым нагрузку по обработке информации на АЭ (информационный
фактор с точки зрения АЭ). Перейдем к формальному описанию качест-
венно отмеченных выше эффектов, то есть исследуем задачу стимулиро-
вания в многоэлементной АС с сильно связанными элементами.
Фиксируем два вектора стратегий y1, y2 ? A' и определим "выигрыш"
i-го АЭ от "перехода" из точки y1 в точку y2:
23
Следует отметить, что "попадание" игроков в точку Нэша и устойчивость по
Нэшу имеют смысл либо в динамике (см. модели коллективного поведения в [83]),
либо в рамках делаемого иногда неявно предположения, что игроки "рассчиты-
вают" равновесную точку априори, моделируя каждый для себя динамику и/или
возможные отклонения всех игроков. При этом проблема интерпретации равно-
весия Нэша в статических играх (при однократном выборе стратегий) остается
на сегодняшний день открытой (см. [22,24,31,34,74,78,85 и др.]).
52
(1.5.4) ?i(y1, y2) = hi(y2) – hi(y1)
и суммарный выигрыш активных элементов системы от такого перехода:
(1.5.5) ?(y1, y2) = H0(y2) – H0(y1),
где
N
? hi ( y ) .
(1.5.6) H0(y) =
i =1
Отметим, что (1.5.6) является утилитарной функцией коллективной
полезности, свойства которой подробно исследуются, например, в [73].
Содержательно, функция H0(y) может интерпретироваться как функ-
ция "системы" из N активных элементов. Функция H0(y) согласована с
введенным выше отношением " f " в следующем смысле: если y1 f y2, то
H0(y1) ? H0(y2) (обратное, вообще говоря, не верно). Введем определение
стимулирования для рассматриваемой модели. Будем различать стимули-
рование двух типов – "внутреннее" и "внешнее". Под внутренним стиму-
лированием будем понимать перераспределение выигрышей между АЭ
системы, то есть внутреннее стимулирование соответствует трансфера-
бельной полезности [73] (до сих пор – в предыдущих разделах –
полезность АЭ не была трансферабельна) и, естественно, должно быть
сбалансировано. Под внешним стимулированием будем понимать
систему наказаний активных элементов центром, которая может
нарушать балансовое ограничение (см. для сравнения модели партнерства
в [73,138]).
Итак, с учетом стимулирования {?i(y)} целевая функция АЭ имеет
вид:
(1.5.7) fi(y) = hi(y) – ?i(y).
Использование центром системы стимулирования
y i = y 2i
??i ( y1 , y 2 ),
(1.5.8) ?i(y1, y2) = ? ? ,
y i ? y 2i
? ? i ( y 2 ? i ),
где
?
? i ( y 2 ?i ) = max hi(yi, y 2?i )
(1.5.9)
?
yi Ai
– стратегия наказания АЭ за отклонение от y2i, y2-i – обстановка для i-го
АЭ в точке y2; в рамках гипотезы благожелательности превращает y2 в
равновесие Нэша, не менее выгодное для i-го АЭ, чем точка y1. Заметим,
что использованием следующей более "жесткой" системы стимулирова-
ния центр может любое действие y2i АЭ сделать его доминантной страте-
гией:

53
y i = y 2i
? 0, ?
? ? ( y, y ), y ? y , ? i ( y , y 2 ) = max hi(y).
?i(y1, y2) =
?? i
y? A©
2 i 2i

В выражении (1.5.8) первый режим соответствует трансферту полез-
ностей (элементу доплачивают или он доплачивает другим АЭ за выбор
y2 вместо y1 – см. также механизм ключевых агентов в [73]), то есть
внутреннему стимулированию, а второй режим – внешнему стимулиро-
ванию – наказанию за индивидуальные отклонения (вопрос о допустимо-
сти тех или иных стратегий наказания с точки зрения ограничений меха-
низма рассматривается ниже).
Перейдем к анализу балансового (бюджетного) ограничения. Так как
трансферты полезности соответствуют внутреннему, то есть замкнутому
относительно множества АЭ, стимулированию, то, очевидно, сумма
трансфертов должна быть неположительна. Если центр имеет возмож-
ность привлечь внешний ресурс в размере С ? 0, то балансовое ограни-
чение, то есть условие внутренней сбалансированности, примет вид:
N
? ?i(y1, y2) = ?(y1, y2) = H0(y2) – H0(y1) ? – С.
(1.5.10)
i =1
Таким образом, с одной стороны в рамках замкнутого набора АЭ
(при C = 0) (1.5.10) – условие неотрицательности баланса трансфертов, а
с другой стороны, как отмечалось выше, это – достаточное условие (с
учетом (1.5.8)) Парето доминирования точкой y2 точки y1 [31,52,87].
Исследуем теперь возможности "переходов с точки зрения балансо-
вого ограничения.
Фиксируем произвольную точку y0 ? A'. Определим множество
P(y0,C) = { y ? A' | ?(y0,y) ? C }
тех действий, в которые АС может быть переведена внутренним стиму-
лированием при заданном балансовом ограничении.
Понятно, что множество точек, в которые АС может быть переведе-
на внутренним стимулированием из любой точки , есть
(1.5.11) P(C) = I P ( y 0 , C ) = { y ? A' | H(y) ? max H(y) – C }.
y? A
'
y 0? A'
Легко показать (см. [87]), что при использовании центром системы
стимулирования (1.5.8), любая точка множества P (C) оптимальна по
Парето, то есть P(C) ? EPN(f) (обратное включение в общем случае не
верно).
Следовательно, внешнее и/или внутреннее стимулирование в ряде
случаев позволяет сделать эффективное по Парето коллективное решение

54
устойчивым по Нэшу. Имея результаты исследования задачи стимулиро-
вания, изучим преимущества и недостатки введения дополнительного
уровня иерархии (выделения над множеством АЭ метаигрока – центра).
Введем следующий механизм функционирования АС. Центр предла-
гает АЭ использовать систему стимулирования (1.5.8) с y2?P(C). При
этом:
– y2 является равновесием Нэша, в котором всем АЭ обеспечивается
не меньшая полезность, чем при выборе любого другого индивидуально
рационального равновесия;
– отпадает необходимость получения и обработки активными эле-
ментами информации о своих партнерах;
– в рамках гипотезы благожелательности центр получает во внут-
ренне сбалансированном механизме ненулевую полезность;
– условно можно считать, что использования стратегии наказания не
происходит (выбор каждым из АЭ стратегии, приводящей к использова-
нию центром стратегии наказания, не выгоден для первого).
Итак, выделение над одноуровневой АС дополнительного уровня
управления с наделением его правом частично устанавливать правила
игры активных элементов (в рамках концепции их некооперативного
поведения) является взаимовыгодным для центра и для всех АЭ, как с
точки зрения снижения на АЭ нагрузки по обработке информации, так и с
"экономической" точки зрения – внешнее управление центра делает
выгодным и индивидуально рациональным коллективно рациональное (в
смысле Парето-эффективности) взаимосодействие АЭ. Это явление в
иерархических активных системах мы будем условно называть "органи-
зационным фактором". Наличие внешнего стимулирования, то есть
институционально установленная возможность центра влиять на пред-
почтения АЭ, может интерпретироваться как "эффект власти" (см. опре-
деление во введении). С этой точки зрения, чем большие наказания
(поощрения) может накладывать центр на АЭ, тем больше его возможно-
сти по управлению (см. результаты по влиянию степени централизации
[22] и ограничений механизма [81] на эффективность управления).
Поэтому стимулирование может интерпретироваться как системооб-
разующий фактор – его введение позволяет согласовать интересы участ-
ников и превращает набор АЭ, каждый из которых ведет себя в соответ-
ствии с принципами индивидуальной рациональности, в систему из
взаимосодействующих АЭ, эффект от деятельности которых не меньше
суммы эффектов деятельности отдельных АЭ (явление эмерджентности).
Аналогичные модели при кооперативном взаимодействии АЭ (в условиях

55
возможности образования коалиций с внутренними дележами [31,73,85])
требуют дальнейших исследований24.
Рассмотрим вопрос о целесообразности привлечения центром внеш-
них средств. Пусть центру достоверно известно, что в отсутствии управ-
ления АЭ выбирают точку y1 (например, y1 – РДС). Тогда [?(y0,y) – C]
доход центра от побуждения АЭ к выбору точки y ? P(y0,C). Если H(y) –
"собственный" доход (или затраты в случае отрицательного знака) от
деятельности совокупности АЭ, то оптимальная величина привлеченных
средств в рамках гипотезы благожелательности может быть найдена из
решения следующей оптимизационной задачи:
(1.5.12) K(C) = max [H(y) + ?(y0,y)] – C > max .
C ?0
y?P ( C , y0 )

Величина
(1.5.13) ?(C) = max [H(y) + ?(y0,y)] / C
y?P ( C , y0 )

может рассматриваться как рентабельность активной системы – ее спо-
собность "усиливать" привлекаемые средства, причем первое слагаемое
отвечает за вклад центра, а второе – за вклад активных элементов.
Следует признать, что в общем случае открытым остается вопрос об
идентификации начального состояния АС y0, так как взятие, например,
гарантированного результата по этому параметру может во многих случа-
ях сделать бессмысленным (неэффективным) рассмотрение задач типа
(1.5.12).
Выгодность выделения центра, то есть введение отношения власти, в
рамках рассматриваемой модели может быть также проинтерпретирована
следующим образом. Пусть y0 – некоторое "начальное" состояние систе-
мы, состоящей лишь из АЭ, y – некоторое "конечное" состояние. Предпо-
ложим, что роль центра заключается в обложении налогом АЭ, предпочи-
тающих состояние y состоянию y0, и установлении системы компенсаций
{?i(y0,y)} элементам с обратными предпочтениями. Если ? ? [0; 1] –
ставка налога, то значение целевой функции i-го АЭ в точке y равно: (1-
?) hi(y) + ?i(y0, y). Из балансового ограничения
24
Выделение над множеством АЭ управляющего органа – центра – имеет явную
"налоговую" интерпретацию, так как трансферты от АЭ к центру и наоборот
могут рассматриваться как система налогов (см. частную модель ниже),
объединяющая АЭ в систему и позволяющая им совместно достигать взаимовы-
годного равновесия. К сожалению, теоретико-игровые модели налогообложения
практически не изучены и представляют собой перспективную и богатую
содержательными интерпретациями и возможными приложениями область
будущих теоретических исследований.
56
N N
? ?
?i(y0, y) ? ? hi(y)
i =1 i =1
получаем, что независимо от величины ставки налога допустимыми
(Парето эффективными для АЭ) являются состояния, удовлетворяющие
условию: H(y) ? H(y0). Содержательные интерпретации этой "налоговой"
модели такие же, как и у моделей, рассматриваемых выше. Отличие
заключается в следующем. До сих пор в настоящем разделе неявно пред-
полагалось, что координация деятельности АЭ не требует от центра
никаких затрат. Если отказаться от этого допущения и предположить,
например, что центр оставляет у себя часть ? ? [0;1] налоговых поступ-
лений, то балансовое ограничение примет вид
N N
? ?
?i(y0,y) ? (1 – ?) ? hi(y).
i =1 i =1
Следовательно, изменится множество Парето эффективных состояний и
т.д.
С одной стороны, в рамках рассматриваемой модели условно можно
считать, что интересы центра согласованы с интересами активных эле-
ментов – чем больше значение целевой функции каждого АЭ, тем больше
N
?
"доход" ? hi(y) центра. С другой стороны, наличие собственных
i =1
интересов у центра изменяет соотношение между множествами индиви-
дуально – и коллективно-рациональных стратегий АЭ. Более того, если в
руках центра сконцентрирована вся власть, включающая в том числе
право устанавливать самостоятельно величину ?, то возникает новый
класс задач согласования интересов участников, представляющих раз-
личные уровни иерархии. К сожалению, чрезвычайно богатый и интерес-
ный с нашей точки зрения класс задач моделирования распределения
властных полномочий (включающий "налоговые" модели, модели зако-
нодательства, распределения функций принятия решений в децентрали-
зованных системах и др.) на сегодняшний день практически не исследо-
ван и его изучение выходит за рамки настоящей работы.
В качестве иллюстрации использования предложенных выше подхо-
дов рассмотрим частный случай линейных активных систем, то есть АС,
в которых целевая функция каждого АЭ линейно зависит от стратегий
всех АЭ:
N
?
(1.5.14) Hi(y) = ?i0 + ?ij yj,
j =1

57
где yj ? Aj = [0;1] (любой отрезок может быть линейным преобразованием
отображен в [0;1]).
В линейных АС у каждого АЭ существует доминантная стратегия:
d
yi
(1.5.15) = Sign(?ii).
N N
? ?
Обозначим ?j = ?ij, ?0 = ?i0. Тогда
i =1 i =1
N
?
(1.5.16) H0(y) = ?0 + ?j yj.
j =1
Парето оптимальная стратегия (доставляющая максимум (1.5.16))
есть:
P
y i = Sign (?i).
(1.5.17)
Очевидно, что, если ? i ? I Sign (?ii) = Sign (?i), то РДС является
эффективным по Парето (содержательные интерпретации этого свойства
совершенно прозрачны). Если ? i ? I: Sign(?ii) ? Sign( ?i ), то требуется
согласование интересов АЭ за счет быть может внутреннего стимулиро-
вания и обеспечение устойчивости Парето оптимальной точки за счет
внешнего стимулирования. Определим следующие величины:
N
?
(1.5.18) ?i(y , y ) = ?i(y , y ) = ?ij [Sign (?j ) – Sign(?jj)].
d P d P

j =1
Легко проверить, что в любых линейных АС выполнено:
N
? ?i(yd, yP) ? 0.
i =1
Пусть центр использует систему внутреннего (первое слагаемое) и
внешнего (второе слагаемое) стимулирования:
P P
(1.5.19) ?i(yi) = ?i(yd, yP) I(yi = y i ) + ?ii I (yi ? y i ),
где I(.) – функция индикатор (отметим, что в точке Парето внешние
штрафы равны нулю).
Использование системы стимулирования (1.5.19) дает каждому АЭ
ту же полезность, что и использование им РДС, причем в рамках гипоте-
зы благожелательности yP является равновесием по Нэшу. Более того,
центр в рамках ГБ оставляет в собственном распоряжении ненулевую
полезность, равную:
N
? ?j [Sign(?j) – Sign(?jj)] ? 0.
(1.5.20) H0 = H0(yP) – H0(yd) =
j =1

58
Величина (1.5.20) может интерпретироваться как мера "системно-
сти" набора АЭ: с одной стороны это – доход центра, а с другой –
интегральная характеристика рассогласованности предпочтений
элементов.
Рассмотрим пример линейной активной системы, модель которой
уже стала хрестоматийной в теории активных систем (введенная в [33]
для иллюстрации непротивоположности интересов игроков, в [22] эта
модель демонстрировала возможность несовпадения РДС и Парето опти-
мальных стратегий; в [78] – возможность достижения Парето оптималь-
ной точки как РН при повторении одношаговой игры и использования
стратегий наказания игроков за индивидуальные отклонения от коллек-
тивно рациональной стратегии).
Пример 1.5.1. Рассмотрим следующую линейную АС:
(1.5.21) hi(y) = yi + ? (1 ? y j ) , Ai = [0;1], N ? 3.
j ?i
d P
yi yi = 0. При этом hi(yd) = 1, hi(yP) = N – 1, то
Очевидно, = 1,
N
?
есть ? i ? I hi(y ) > hi(y ). Вычисляем H0(y) = N (N – 1) + (2 – N)
P d
yi.
i =1
Воспользовавшись (1.5.19), получаем, что
? (1 ? y j ) – I(yi ?
P
y i ),
fi(y) =
j ?i
то есть Ed(f) ? EP(h). Выигрыш центра в рамках ГБ – H0 = N (N – 1). •
В рассмотренном примере противоречие между индивидуальными и
коллективными интересами было явным (что объясняет такое большое
значение H0) и привлечение внешних средств не имело смысла. Приведем
пример, в котором рассогласование интересов не столь значительно.
Пример 1.5.2. Пусть в линейной АС имеются два АЭ, целевые функ-
ции которых равны: h1(y) = ? y1 – ? y2; h2(y) = -? y1 + ? y2; ?, ?, ?, ? ? 0;
? < ?, ? > ?, то есть вклад первого АЭ в свою целевую функцию меньше,
чем в целевую функцию второго АЭ, а у второго АЭ – наоборот.
Вычисляем: yd = (1; 1), yP = (0; 1); ?1(yd, yP) = – ?, ?2(yd, yP) = ?;
H(y) = (? – ?) y1 + (? – ?) y2, H(yP) – H(yd) = ? – ? > 0 – эффект организа-
ции.
Используя систему стимулирования ?1(y) = – ? I(y1 = 0), центр доби-
вается того, что Парето оптимальная стратегия каждого АЭ становится
доминантной. При этом f1(yP) = f1(yd), f2(yP) = f2(yd). Доход центра в равно-
весии H0 = ? – ? > 0.

59
Пусть ye ? [0; 1]2 – желательное с точки зрения внешней среды или
центра состояние АС. Например, положим ye = (1; 0). Тогда h1(ye) = ?,
h2(ye) = -?; ?(yd,ye) = ? – ? > 0, то есть, используя систему стимулирова-
ния {?1(yd, ye); ?2(yd, ye)}, центр побуждает АЭ выбирать состояние ye. •
Закончив рассмотрение примеров, отметим, что в рамках предло-
женного подхода центр может рассматриваться как еще один активный
элемент, являющийся метаигроком – обладающим правом устанавливать
правила игры (в том числе – налагать несбалансированные штрафы на
остальных игроков и т.д., см. также [114,138]), целевая функция которого
есть сумма целевых функций АЭ. Такая интерпретация управляющего
органа согласована с пониманием коллективной рациональности (объе-
диняющей элементы в организационную систему) как эффективности по
Парето.
В заключение настоящего раздела рассмотрим класс механизмов
коллективного стимулирования.
В механизмах коллективного стимулирования вознаграждение каж-
дого АЭ зависит не только от его собственных действий, но и от некото-
рой общей для всех АЭ функции – "агрегата" действий других АЭ, дру-
гими словами – от результата деятельности всего коллектива. С точки
зрения терминологии такого рода активные системы можно с полным
правом назвать активными системами с сильно связанными (взаимодей-
ствующими) активными элементами [19,24,81]. Как показывает анализ
немногочисленных работ, посвященных исследованию многоэлементных
задач стимулирования, на сегодняшний день отсутствуют общие анали-
тические методы их решения, а предложенные численные методы и
алгоритмы обладают колоссальной вычислительной сложностью и не
дают возможности исследовать зависимость решения и его свойств от
параметров модели (см., например, обзоры [19,78]).
Рассмотрим следующую модель коллективного стимулирования.
Пусть результат деятельности коллектива из N активных элементов
является функцией их действий:
(1.5.22) z = Z(y1, y2, ..., yN) ? A0,
N
? Ai
то есть Z: A' > A0, где y ? A' = , y = (y1, y2, ..., yN). Предположим,
i =1
что стимулирование i-го АЭ есть ?i: A0 > ?1, i ? I. Если ?i одинаковы для
всех АЭ, то получаем унифицированную систему (см. раздел 1.7) коллек-
тивного стимулирования ("уравниловка"), при которой вознаграждения
всех АЭ одинаковы и не зависят явно от их индивидуальных вкладов в
результат деятельности коллектива.
60
В случае, когда индивидуальные действия АЭ наблюдаемы (стано-
вятся известными центру), возможно использование индивидуальных
систем стимулирования. Далее мы будем предполагать, что действия АЭ
не наблюдаются центром, которому известен лишь общий результат.
Если отображение Z(?) взаимно однозначно, то задача стимулирова-
ния в многоэлементной системе "распадается" на набор независимых
одноэлементных задач, методы решения для которых хорошо известны.
Однако, в общем случае, однозначное восстановление индивидуальных
действий, только лишь по наблюдаемому результату деятельности кол-
лектива, невозможно. Целевая функция i-го АЭ имеет вид:
(1.5.23) fi(y) = ?i(Z(y)) – ci(yi).
Обозначим EN(?) ? A – множество равновесий Нэша (множество ре-
шений игры, множество реализуемых действий), зависящее от системы
стимулирования. В общем случае EN(?) может содержать более одной
точки, более того – одни равновесия Нэша могут Парето доминировать
другие (см. обсуждение выше, а также пример ниже). Поэтому при опре-
делении эффективности стимулирования адекватно использование мак-
симального гарантированного результата:
(1.5.24) K(?) = min ?(y).
y?E N (? )

Задача стимулирования заключается в выборе ?* ? Arg max K(?).
? ?M
Как отмечалось выше, одним из путей "сокращения" множества ре-
шений игры является допущение о возможности осуществления побоч-
ных платежей между АЭ, что может позволить исключить некоторые
неэффективные по Парето равновесия (см. также пример ниже).
Вторым возможным путем является реализуемый ниже подход, ко-
гда центр выбором специального механизма побуждает АЭ выбрать
конкретное, наиболее выгодное для центра, равновесие.
Определим
˜
Z (z) = {y ? A' | Z(y) = z},
(1.5.25)
N
min ?
(1.5.26) ?(x) = ci(yi),
˜
i =1
y ?Z ( x )
N
y (x) = arg min ?
$
(1.5.27) ci(yi),
˜
i =1
y?Z ( x )




61
?^
?
(1.5.28) ?i(x,z) = ?c i ( y i ( x )), z ? x .
? 0, z<x
?
˜
Содержательно, Z (z) – множество тех комбинаций действий АЭ,
которые приводят к результату деятельности z, ?(x) – минимальные
$
затраты центра на стимулирование по реализации результата x, y (x) –
конкретная комбинация действий АЭ, приводящая к результату x и
минимизирующая затраты на стимулирование, ?i(x,z) – система
индивидуального стимулирования QK-типа, реализующая вектор
$
действий y (x).
При отсутствии ограничений задача стимулирования сводится к за-
даче поиска допустимого результата деятельности, максимизирующего
разность между доходом центра и затратами на стимулирование (1.5.26).
Решение этой задачи подставляется в (1.5.28), что дает оптимальную
систему стимулирования. Если присутствуют дополнительные ограниче-
ния на систему стимулирования, то они должны учитываться по аналогии
с тем, как это делалось ранее.
Если задача центра заключается в назначении унифицированной
системы коллективного стимулирования, то последняя может быть най-
дена объединением предложенного метода и алгоритма, приведенного в
разделе 1.7. Эффективность унифицированной системы стимулирования
при этом оказывается не выше, чем индивидуальной.
Рассмотрим пример, иллюстрирующий описанные эффекты и при-
менение предложенного метода решения.
2
Пример 1.5.3. Пусть N = 2, H(x) = ?x, ci(yi) = ?i y i , z = y1 + y2. Целе-
вая функция i-го АЭ: fi(y1, y2) = ?(y1 + y2) – ci(yi). Решение задачи
c1(y1) + c2(y2) > min
y1+ y2 = x
?2 ?1
$ $
y 1(x) = y 2(x) =
имеет вид: x. Минимальные затра-
x,
?1 + ? 2 ?1 + ? 2
ты на стимулирование по реализации результата x ? 0 равны
?1 ? 2
?(x) = x2.
?1 + ? 2



62
max {H(x) – ?(x)}, получаем, что оптимален план:
Вычисляя
x?0

( ? 1 + ? 2)
x* = ? что обеспечивает эффективность управления
,
2 ?1 ? 2
( ? 1 + ? 2)
K =?
* 2
.
4 ?1 ? 2
Определим теперь множество EN(?) равновесий Нэша. Для этого
введем в рассмотрение следующие множества: Yi(?i(x)) = {y ? A |
ci(y) ? ?i(x)}, i = 1, 2.
Пусть ? y ? Yi(?i(x)), x ? y, i = 1,2. Тогда
˜
EN (?(x)) = (Y1(?1(x)) ? Y2(?2(x)) ? Z (x)) ? {(0, 0 )}.
Таким образом, в рассматриваемом примере имеется множество
˜
(континуум!) равновесий Нэша – отрезок (Y1(?1(x)) ? Y2(?2(x)) ? Z (x)) и
точка (0,0), причем внутренние точки этого отрезка являются точками,
эффективными по Парето, и доминируют по Парето точку (0,0).
При использовании центром системы стимулирования (1.5.28) с вы-
численным ранее значением x* множество равновесий Нэша "схлопывает-
$ $
ся" в одну точку с координатами ( y 1(x*), y 2(x*)).
$
y
Содержательно, вычисляя в соответствии с (1.5.27) и используя
систему стимулирования (1.5.28), центр побуждает АЭ выбрать наиболее
$
выгодное для него равновесие y ? EN . При этом не исключено, что
могут существовать лучшие для АЭ (в смысле Парето) равновесия, по-
пасть в которые они не могут в силу предположения о бескоалиционно-
сти игры. Более того, введение предположения о трансферабельности
полезности АЭ (возможности взаимовыгодного перераспределения
полезностей между активными элементами) приводит к неустойчивости
$
точки y в следующем смысле. Пусть t12 – выплаты первого АЭ второму,
t21 – второго – первому, t12+t21 = 0. Взаимовыгодность выплат при "пере-
$
ходе" из точки y в некоторую точку y' подразумевает одновременное
выполнение следующих условий:
$ $
t12 ? c1(y1') – c1( y 1), t21 ? c2(y2') – c2( y 2).
После несложных преобразований получаем, что
$ $
c1( y 1) + c2( y 2) ? c1(y1') + c2(y2').
63
$
y
Из определения точки следует, что последнее неравенство имеет
˜
место для любых y' ? Z (x).•
Таким образом, оптимальное в рамках концепции равновесия Нэша,
решение оказывается неустойчивым, если появляется возможность про-
явления коалиционных эффектов.
Выше в настоящем разделе исследовалась задача коллективного
стимулирования в двухуровневой активной системе, то есть изучалась
целесообразность выделения из множества АЭ управляющего органа.
Аналогично может моделироваться выделение дополнительных (более
высоких) уровней иерархии в любой многоуровневой АС. Использование
систем коллективного стимулирования в многоуровневых АС привлека-
тельно в первую очередь потому, что оно снижает информационную
нагрузку на более высокие уровни иерархии – агрегат (1.5.22) может
рассматриваться как результат деятельности подсистемы в целом. Поэто-
му индивидуальное поощрение АЭ за результаты деятельности коллекти-
ва является одним из проявлений организационного эффекта.
Следует отметить, что рассматривалась целесообразность выделения
именно одного центра. Если взаимодействие АЭ нижнего уровня струк-
турировано (например, матрица в (1.5.14) имеет блочную структуру, или
множество АЭ может быть разбито на коалиции и т.д.), то, быть может,
следует вводить одновременно несколько промежуточных центров – во
всех подобных случаях необходимо детальное исследование структуры
множеств равновесий (Нэша, Парето и т.д.).
Итак, проведенные рассуждения дают частичный ответ на вопрос об
условиях целесообразности выделения из множества АЭ одного уровня
метаигрока, то есть введения дополнительного уровня иерархии. Вопрос
об эффективности введения более высоких уровней над центрами (цен-
трами промежуточного уровня в используемой терминологии) может
решаться аналогичным образом.

1.6. СТИМУЛИРОВАНИЕ И ОГРАНИЧЕНИЯ НА ОБЪЕМ
ПЕРЕРАБАТЫВАЕМОЙ ИНФОРМАЦИИ

Одним из общепризнанных объяснений факта существования иерар-
хий является ограниченная способность элементов организационных
систем (в первую очередь – человека) по получению и переработке ин-
формации. Обусловленный этим ограничением фактор во введении к
настоящей работе было предложено называть информационным факто-

64
ром. В настоящем разделе рассматривается информационный фактор в
задачах стимулирования, причем внимание на других факторах –
экономическом, агрегирования и т.д. – не акцентируется.
Любой участник активной системы находится в информационном
взаимодействии (получает, перерабатывает и передает информацию) как
со всеми остальными участниками АС, так и с окружающей средой.
Понятно, что, если часть ресурсов (временных, финансовых и др.) расхо-
дуется на переработку информации, то на остальные виды деятельности
остается меньшая часть этих ресурсов. Очевидно также, что количество
перерабатываемой информации растет с ростом числа участников систе-
мы. С другой стороны, введение специализированных органов (например,
дополнительных центров), отвечающих за переработку информации, и
приводящее к снижению нагрузки на других участников, требует опреде-
ленных затрат. Возможности этих специализированных органов по пере-
работке информации, в свою очередь, также ограничены. Следовательно,
возникает оптимизационная задача – каков должен быть "размер" органи-
зации, то есть число ее участников и структура их информационного
взаимодействия.
Одним из простейших способов формализации описанной выше ка-
чественно задачи является введение в целевую функцию АЭ или АС в
целом (центра) показателя, который бы обеспечивал убывание целевой
функции с ростом числа участников АС, с которыми ему приходится
обмениваться информацией (получать заявки, информацию о состоянии,
передавать управляющие воздействия и т.д.). Тогда, наряду с задачей
собственно управления (синтеза механизма управления фиксированной
АС), можно было бы решать задачи разбиения АЭ по подсистемам,
задачи определения числа уровней иерархии, числа промежуточных
центров и др., благо, что соответствующий математический аппарат уже
достаточно развит в исследовании операций (задачи математического
программирования, задачи о назначении и т.д.).
Проблема заключается в том, что для введения в целевые функции
конкретных "информационных" показателей необходимо иметь модели,
которые достаточно адекватно описывали бы процессы переработки
информации участниками организационной системы. Таких универсаль-
ных показателей и моделей на сегодняшний день, к сожалению, нет.
Более того, проблемы описания информационного взаимодействия воз-
никают не только в теоретико-игровых моделях функционирования
иерархических систем, но и в гораздо более широком круге явлений и
процессов – в человеко-машинных системах, системах связи [14,106], в
процессах научения и адаптации в биологических, кибернетических и
65
социально-экономических системах [69,76,105]. Отчасти существующее
положение дел может быть оправдано чрезвычайной сложностью моде-
лируемого объекта.
Пожалуй, одними из немногих общепризнанных и широко исполь-
зуемых закономерностей являются: постулат, принимаемый всюду – от
теории связи до биокибернетики, об ограниченности пропускной способ-
ности каналов передачи информации в живых и неживых системах
[8,54,61,69,104,105,123] и закон Хика [113] (отражающий пропорцио-
нальность в определенном диапазоне между количеством информации,
содержащейся в некотором сигнале, обрабатываемой человеком, и неоп-
ределенностью этого сигнала). Но даже эти две закономерности отражают
скорее качественные, а не количественные стороны процессов, соответст-
венно, переработки и передачи информации.
Следует отметить, что при анализе информационного фактора ино-
гда оказывается целесообразным разделение информации, получаемой и
перерабатываемой управляющим органом, на несколько типов. В первом
приближении очень условно можно классифицировать информацию по
возможности автоматизации ее обработки. Поясним последнее утвержде-
ние. Если часть функций принятия решений управляющим органом
может быть передана, например, компьютерным системам поддержки
принятия решений [92,93], обрабатывающим значительную "количест-
венную" составляющую информационного потока, то это позволяет
уменьшить его информационную нагрузку. В этом случае иногда может
оказаться возможным, например, часть центров промежуточного уровня
заменить их "эмуляторами" и рассматривать метасистему как одного
участника АС – "штаб" центра, который моделирует внутри себя функ-
ционирование двух верхних уровней иерархии. Однако возможности
автоматизации механизма принятия решений ограничены – всегда суще-
ствует некоторая часть трудно формализуемых, качественных показате-
лей и параметров (например, психологические, социальные и др. аспекты
взаимодействия подчиненных). Зачастую, именно возможности центра по
обработке качественной, "человеческой" составляющей информации
являются ключевыми. Поэтому при анализе влияния информационного
фактора необходимо учитывать как качественную неоднородность ин-
формации, так и возможность автоматизации ее обработки.
Итак, можно констатировать, с одной стороны, востребованность
общих количественных результатов, отражающих ограничения на объем
перерабатываемой информации в сложных системах, а с другой –
вынужденную необходимость использования в конкретных моделях
частных, иногда даже спорных, гипотез и зависимостей (см. обсуждение в
[76]). Поэтому ниже в настоящем разделе рассматриваются несколько
66
Поэтому ниже в настоящем разделе рассматриваются несколько доста-
точно частных моделей, отражающих информационные ограничения в
иерархических АС и выполняющих функцию иллюстративных примеров.
Рассмотрим набор из N активных элементов. Предположим, что ка-
ждый из АЭ для принятия решения (например, вычисления равновесной
точки – см. раздел 1.5) должен получить некоторую информацию обо
всех своих партнерах. Количество информации растет с ростом числа АЭ.
Если возможности каждого АЭ по переработке информации ограниче-
ны – большая информация требует большего времени для переработки, а
эффективность решения зависит от времени его принятия, то возникает
задача определения оптимального числа АЭ в системе.
Пример 1.6.1. Пусть в АС, состоящей из N однородных АЭ множест-
во допустимых действий АЭij: Aij = [A-; A+]. Обозначим ? = A+ – A-, тогда
информация, требующаяся для идентификации допустимых действий,
составляет [14,106] 25: H = ln ?.
Учет фактора времени произведем следующим образом: зависимость
текущей эффективности некоторого решения (управляющего воздействия
или выбора конкретной стратегии) дисконтируется с множителем ?:
?(t) = ?0 e-?t, где ?0 – эффективность немедленной реализации решения.
Если H0 = ? H, ? ? [0;1] – верхнее ограничение количества информа-
ции, перерабатываемой одним АЭ в единицу времени, то время, затрачи-
ваемое одним АЭ на переработку информации о своих партнерах, соста-
вит: t(N) = H/H0 = N/?. Пусть эффективность деятельности АС имеет
постоянный доход на масштаб [22,73,118], то есть ?0(N) = ? N. Тогда
зависимость текущей эффективности от числа АЭ имеет вид:
?(N) = ? N exp ( – ?N / ? ).
Максимум эффективности (оптимальный "размер" организации)
достигается при N = Nmax = ? / ?.
Качественный анализ выражения для Nmax позволяет придти к сле-
дующим вполне соответствующим практическому опыту выводам: опти-
мальное количество АЭ не зависит от коэффициента пропорциональности
?; с ростом коэффициента ?, отражающего степень учета будущего,
оптимальный размер АС уменьшается (то есть в быстро меняющихся
внешних условиях организации меньшего размера более эффективны –
существенным становится эффект инерционности принятия решений,

25
Можно надеяться, что использование неудачной, но исторически сложившей-
ся, системы обозначений, в которой доход центра и энтропия обозначаются
одним символом не приведет к путанице. Кроме того, отметим, что энтропия
определена выше с точностью до мультипликативной константы [14,95].
67
зависящий от размера организации); с ростом возможностей элементов
АС по обработке информации оптимальный размер организации увели-
чивается. •
Интересно отметить, что в примере 1.6.1 рассматривалось взаимо-
действие АЭ, находящихся на одном – низшем – уровне иерархии, при-
чем, если применить аналогичные рассуждения к промежуточным уров-
ням иерархии – например – к некоторому промежуточному центру, то
получится следующий качественный вывод: чем выше уровень иерархии,
тем меньшее количество управляемых объектов должно находиться в
подчинении управляющего органа, расположенного на этом уровне.
Последнее утверждение следует из того, что центрам промежуточного
уровня, помимо информации о подчиненных АЭ, необходимо обрабаты-
вать информацию от участников того же уровня. Поэтому можно предпо-
лагать, что с точки зрения информационных ограничений при однород-
ных участниках (обладающих одинаковыми способностями к переработке
информации и принятию решений) на каждом уровне иерархии должно
находиться не больше промежуточных центров, чем на более низком
уровне.
В случае идеального агрегирования информации последнее утвер-
ждение может выполняться как тождество (число элементов в каждой из
подсистем на каждом уровне иерархии может быть одинаковым), и может
нарушаться, если на более высоких уровнях иерархии находятся элемен-
ты, обладающие более высокими способностями к переработке информа-
ции, чем элементы нижнего уровня (что, к счастью, иногда имеет место
на практике).
Следует признать, что в реальных организационных системах неред-
ко имеет место обратное соотношение – чем выше уровень иерархии, тем
больше число подчиненных у соответствующего управляющего органа.
Отчасти это расхождение может быть объяснено путем разделения
управляемых субъектов на непосредственно подчиненных данному
органу управления и вспомогательных, обеспечивающих деятельность
соответствующих подсистем.
Аналогом рассмотренной в примере 1.6.1 модели является модель, в
которой каждый АЭ должен потратить определенное время на коммуни-
кацию с каждым из партнеров в условиях ограниченности общего време-
ни их совместного функционирования.

<<

стр. 2
(всего 5)

СОДЕРЖАНИЕ

>>