<<

стр. 3
(всего 4)

СОДЕРЖАНИЕ

>>

70
v
А.6. Если ? ? M, то ? ?i ? [0; 1], i ? Nf выполнено:
(?1 ?1, ?2 ?2, …, ? n f ? n f ) ? M.
Содержательно, предположение А.6 означает, что множество
допустимых управлений (имеющее вид конусного отрезка с верши-
ной в нуле) обладает следующим свойством: если допустимо неко-
торое управление (некоторый вектор выплат агенту), то допустимо
любое другое управление, при котором вознаграждение агента за
каждую из компонент его деятельности не ниже исходного.
Определим множество
(17) PK(M) = {y ? A | (c1(y), c2(y), …, cn f ( y ) ) ? M},
то есть множество действий агента, реализуемых в рамках ГБ1
системами стимулирования типа (16) с ? = 0, принадлежащими
множеству M.
v
Обозначим P(M) = U Par(A, ? , {fi}) - множество действий,
r
? ?M
которые могут быть реализованы (то есть сделаны эффективными
по Парето) при использовании центром функций стимулирования
из множества M.
Покажем, что класс систем стимулирования (16) (с параметром
y ? A) характеризуется максимальным множеством реализуемых
*

действий.
Лемма 16. Пусть выполнены предположения А.1-А.4 и А.6. То-
гда PK(M) = P(M).
Доказательство. Пусть ? y' ? P(M): y' ? PK(M). Тогда
(c1(y'), c2(y'), …, cn f ( y ' ) ) ? M. Фиксируем систему стимулирова-
r r
ния ? ? ? M такую, что y' ? Par(A, ? ? , {fi}). В силу предположения
?? i' ( y ), y = y '
r
А.6 выполнено y' ? Par(A, ? 1 , {fi}), где ?1i(y) = ? ,
y ? y'
? 0,
i ? Nf. В силу условий реализуемости ?1i(y') ? ci(y'), i ? Nf, что
противоречит предположению А.6. •

1
При отказе от ГБ множество гарантированно реализуемых действий
агента (являющееся внутренностью множества PK(M)) будет незамкну-
тым, что приведет к "техническим" проблемам при постановке и реше-
нии соответствующих оптимизационных задач (см. также раздел 2.1).
71
Следствие 17. Пусть выполнены предположения А.1-А.4 и А.6.
Тогда в рамках гипотезы благожелательности система стимулиро-
вания (16) с ? = 0 является оптимальной в классе M.
Доказательство. Эффективность класса систем стимулирова-
ния типа (16) равна
(18) KK = max {H(y) - ? ci ( y ) }.
y?PK ( M ) i? N f
Эффективность оптимальной в классе M системы стимулиро-
r
вания ? ? равна
r
? ? i' ( y) }.
(19) K(? ? ) = max {H(y) -
y?P ( M ) i? N f
В силу введенных предположений выполнено
r
y' ? Par(A, ? 1 , {fi}),
где
?? i' ( y ), y = y '
(20) ?1i(y) = ? , i ? Nf.
y ? y'
? 0,
Из условий реализуемости следует, что для оптимального дей-
r
ствия y' ? A, реализуемого системой стимулирования ? ? , должно
выполняться
(21) ?1i(y') ? ci(y'), i ? Nf.
Сравнивая (18) и (19), с учетом (20) и (21), а также результата
r
леммы 16, получаем, что KK = K(? ? ). •
Оптимальное реализуемое действие в обоих случаях определя-
ется из условия максимума целевой функции центра:
(22) y* = arg max {H(y) - ? ci ( y ) }.
y?PK ( M ) i? N f
Итак, в рамках введенных предположений оптимальное реше-
ние задачи стимулирования в модели РК 14 имеет вид (16), (22).
Еще раз отметим, что одним из преимуществ систем стимулирова-
ния вида (16) с ?i > 0, i ? Nf, является то, что при их использовании
центром множество Парето оптимальных стратегий агента состоит
из единственной точки.
В результате рассмотрения задачи стимулирования в ОС с
агентом, имеющим векторные предпочтения, можно сделать сле-
дующий общий качественный вывод: в силу аддитивности каждой
72
из компонент целевой функции агента по стимулированию, а также
в силу аддитивности целевой функции центра по стимулированию,
набор целевых функций, отражающий предпочтения агента, может
с точки зрения центра (см. (22)) быть заменен единственной целе-
вой функцией, являющейся их суммой (c(y) = ? ci ( y ) ,
i? N f

? ? i ( y)
?(y) = = ?(y)). При этом один агент с векторными пред-
i? N f
почтениями может рассматриваться как nf агентов, имеющих ска-
лярные предпочтения и выбирающие одно и то же действие.
Таким образом, в модели РК 14 (то есть в ОС, в которой имеет-
ся агент с векторными предпочтениями, на каждую из компонент
которых влияет соответствующая компонента вектора управлений)
возможно аналитическое решение задачи управления. Напомним,
что при обсуждении модели РК 13 (модели первого уровня сложно-
сти, в которой впервые появляются векторные предпочтения - см.
раздел 2.2.4) отмечалось, что на сегодняшний день в общем случае
не решена проблема определения рационального выбора агента при
его многокритериальных предпочтениях. В задаче стимулирования
при отсутствии "сильных" ограничений на взаимосвязь критериев
агента (см. предположение А.4) и взаимозависимость управлений
(см. предположение А.5) удается добиться единственности Парето
оптимального действия агента, что позволяет конструктивно опре-
делить его рациональный выбор и исследовать зависимость по-
следнего от выбираемых центром управлений.


2.3.6. Модель РК15
r
В модели РК15 ?РК15 = {nA = 1, f , k ? 2, u} управление со сто-
роны центров скалярно, поэтому ее отличие от "ближайшей" моде-
ли первого уровня сложности - модели РК3 (см. рисунок 5) - за-
ключается в том, что скалярные действия агента оцениваются им
по нескольким критериям. Задача стимулирования при этом бес-




73
смысленна1 (см. также описание модели РК13 в разделе 2.2.4), а в
общем случае основная проблема заключается в определении
рационального (с учетом многокритериальности предпочтений)
выбора агента при заданных управлениях (см. обсуждение в разде-
ле 2.2.4).


2.4. МОДЕЛИ ТРЕТЬЕГО УРОВНЯ СЛОЖНОСТИ

В моделях третьего уровня сложности (модели: РК 8, РК 10,
РК 11, РК 16 - см. рисунок 5) отсутствует только один из четырех
присущих ОС РК характерных признаков: в модели РК 8 агент
имеет скалярные предпочтения, в модели РК 10 имеется один
центр, в модели РК 11 управление, выбираемое несколькими цен-
трами, скалярно, в модели РК 16 скалярно множество допустимых
действий агента. В то же время, именно в моделях третьего уровня
сложности в полной мере проявляются все специфические для
распределенного контроля эффекты (см. также описание наиболее
общей модели ОС РК - модели РК 12 - в разделе 2.5).


2.4.1. Модель РК8
r
Отличие модели РК 8 (?РК8 = {nA ? 2, f, k ? 2, u } - см. рисунок
5) от модели РК 4 заключается в наличии многомерного множества
допустимых действий агента, от модели РК 6 - в наличии несколь-
ких центров, от модели РК 7 - в наличии векторных управлений.
Решение задачи стимулирования для этого случая дается тео-
ремами 10-12, так как при их доказательстве никаких предположе-


1
Если считать, что компенсаторная система стимулирования должна
компенсировать агенту суммарные затраты (где суммирование произво-
дится по компонентам целевой функции, то есть предпочтения счита-
ются аддитивными), то решение задачи стимулирования дается теоре-
r
r r
мами 10-12, если предположить, что {yi( u )}, y( ? ) ? Par(A, u , {fi}) -
известные зависимости. Однако, содержательные интерпретации
результатов применения такого подхода затруднительны.
74
ний относительно размерности множества A не вводилось (см.
также описание модели РК 7 в разделе 2.3.3).


2.4.2. Модель РК10
r r
Отличие модели РК 10 (?РК10 = {nA ? 2, f , k =1, u } - см. рису-
нок 5) от модели РК 6 заключается в наличии векторных предпоч-
тений агента, от модели РК 9 - в наличии векторных управлений, от
модели РК 14 - в наличии многомерного множества допустимых
действий агента.
Так как при исследовании модели РК 14 никаких предположе-
ний относительно размерности множества A не вводилось (см.
утверждения 13-17), то все полученные в разделе 2.3.5 результаты
остаются в силе и для модели РК 10.


2.4.3. Модель РК11
r
Отличие модели РК 11 (?РК11 = {nA ? 2, f , k ? 2, u} - см. рису-
нок 5) от модели РК 7 заключается в наличии векторных предпоч-
тений агента, от модели РК 9 - в наличии нескольких центров, от
модели РК 15 - в наличии многомерного множества допустимых
действий агента.
В данной модели одновременно имеют место, как игра цен-
тров, так и векторные предпочтения агента, то есть оба характер-
ных для ОС РК признака, поэтому для нее справедливы получен-
ные в разделах 2.2.2 и 2.3.5 результаты, независимо справедливые
для моделей РК 3 и РК 14 соответственно. В силу скалярности
управления содержательные интерпретации задачи стимулирования
для модели РК 11 затруднительны (см. также предположения А4,
А.5 и комментарии к теореме 13).




75
2.4.4. Модель РК16
r r
Отличие модели РК 16 (?РК16 = {nA = 1, f , k ? 2, u } - см. ри-
сунок 5) от модели РК 4 заключается в наличии векторных пред-
почтений агента, от модели РК 14 - в наличии нескольких центров,
от модели РК 15 - в наличии векторных управлений.
В данной модели наиболее ярко проявляются все характерные
для ОС РК признаки - и игра центров, и векторные предпочтения
агентов при векторных управлениях. Несколько забегая вперед,
отметим, что, несмотря на то, что данная модель принадлежит
классу моделей третьего уровня сложности (существует более
общая модель - модель РК 12, принадлежащая максимальному -
четвертому - уровню сложности), все результаты, приведенные в
настоящем разделе, справедливы и в самом общем случае, то есть
применимы для модели РК 12, так как множество допустимых
действий агента не предполагается одномерным (см. ниже).
Общая постановка задачи управления в модели РК 16 практи-
чески повторяет постановку задачи управления в модели РК 3
(равновесие Нэша в игре центров определяется аналогично выра-
жению (1) раздела 2.2.2), отличие заключается в том, что вводятся
дополнительные предположения относительно множества дейст-
вий, реализуемых данными управлениями центров, например,
может считаться, что действие агента принадлежит множеству
r
недоминируемых по Парето действий Par( u ), и т.д. Исследуем
задачу управления на примере модели стимулирования.
Введем следующее предположение1.
А.7. Функции ci(y), i ? Nf; Hi(y), i ? K, удовлетворяют предпо-
ложению А.2.
Целевая функция i-го центра в рассматриваемой модели сти-
мулирования имеет вид:
r
? ? ij ( y) , i ? K
(1) Wi( ? i , y) = Hi(y) -
j? N f


1
Для простоты изложения будем считать, что ограничения на стимули-
рование отсутствуют (если они присутствуют, то их учет производит-
ся по полной аналогии с тем как это делалось в разделе 2.3.5 при исследо-
вании модели РК 14).
76
r
где ? i = ( ? 1 , ? 2 , …, ? n f ) - вектор стимулирований, выбранный
i i i

i-ым центром.
Предпочтения агента в общем случае описываются вектор-
функцией с компонентами1:
r
? ? i j ( y) - ci(y), i ? Nf.
(2) wi(? , y) =
j?K
В соответствии с результатами утверждений 14-17, минималь-
ные суммарные затраты центров на стимулирование по реализации
действия y ? A равны:
(3) ?(y) = ? ci ( y ) .
i? N f
Введем в рассмотрение систему стимулирования
? ?ij , y = y *
r
(4) ? i ( ?i , y ) = ?
j
, i ? Nf, j ? K,
?0, y ? y
*
r
где ?i = ( ?1 , ?i , …, ?i ), i ? Nf. Величины
2 k
i

? ?ij , i ? K,
(5) ?i =
j? N f

? ?ij , j ? Nf,
(6) ?j =
i?K
определяют соответственно сумму затрат на стимулирование,
выплачиваемых по всем компонентам i-ым центром, и выплачивае-
мых всеми центрами по j-ой компоненте целевой функции агента.
Из результатов разделов 2.1 и 2.3.5 следует, что в рамках гипо-
тезы благожелательности система стимулирования (4), для которой
выполнено
(7) ?j = cj(y*), j ? Nf,
является минимальной системой стимулирования, реализующей
действие y* ? A.



1
Напомним, что в соответствии с принятой системой обозначений
центры нумеруются верхними индексами, а компоненты целевой функции
агента - нижними индексами.
77
Рассмотрим теперь условие того, что система стимулирования,
описываемая матрицей ? = || ?ij ||, i ? Nf, j ? K, является равновеси-
ем Нэша в игре центров. Определим максимальный выигрыш i-го
центра при условии, что он самостоятельно побуждает агента
выбирать те или иные действия:
? ci ( y ) }, i ? K.
i
(8) Wmax = max {Hi(y) -
y? A i? N f
Наиболее выгодное для i-го центра действие агента в этом слу-
чае есть
? ci ( y ) }, i ? K.
i
(9) y max = arg max {Hi(y) -
y? A i? N f
Условие выгодности для i-го центра использования системы
стимулирования (4) имеет вид
i
(10) Hi(y*) - ?i ? Wmax , i ? K.
По аналогии с моделью РК 3 можно доказать, что равновесие
Нэша в игре центров определяется следующим утверждением.
Лемма 18. Пусть выполнены предположения А.3 и А.7. Тогда
множество равновесий Нэша в игре центров имеет вид:
(11) ? = {?, y* | ?ij ? 0, y* ? A, (7), (10)}.
Следовательно, если множество ?, определяемое выражением
(11) не пусто, то при использовании минимальных систем стимули-
рования (4) существует равновесие Нэша в игре центров, опреде-
ляемое выражениями (7) и (10).
i
Упорядочим центры в порядке убывания величин Wmax , i? K,
и введем следующее предположение относительно рационального
выбора агента.
А.8. При заданной системе стимулирования агент выбирает из
недоминируемых по Парето действий то действие, которое обеспе-
чивает максимум суммарного стимулирования.




78
Лемма 19. Пусть выполнены предположения А.3, А.7 и А.8.
Тогда, если множество ? пусто, то равновесные1 стратегии центров
определяются следующими выражениями:
? ?ij , y = y *i
? i* j ( ?, , i ? Nf, j ? K,
y) = ?
(12)
0, y ? y *i
?
(13) y* = y*1 = y1 ,
max

(14) ?1 ? 0, ?1 = ?( y1 ) + Wmax +?,
2
i max

а y*i, ?ij и ? - любые, удовлетворяющие следующим условиям:
1 2
(15) y*i ? A, ?i ? [0; Hi(y*i)], i = 2, k , ? ? (0; Wmax - Wmax ].
Доказательство леммы 19 повторяет доказательство леммы 11
с учетом многокритериальности предпочтений агента и опускается.
Содержательно диктатор обеспечивает агенту максимальное
стимулирование, определяемое выражением (14). Предположение
А.8 нужно для доопределения рационального выбора агента, иначе
при фиксированном суммарном выигрыше агента, равном
2
Wmax +?, может оказаться, что множество Парето содержит точки,
отличные от y1 . В силу этого, предположение А.8 может быть
max
заменено на любое другое предположение, однозначно опреде-
r
ляющее действие y(? ), выбираемое агентом при заданной системе
стимулирования типа (12). Результат леммы 19 при этом практиче-
r
ски не изменится (необходимо заменить y* на y(? ) и т.д.), так как
r
действие y(? ) всегда может быть реализовано диктатором.
Объединяя результаты лемм 18 и 19, получаем следующее ут-
верждение.
Теорема 20. Пусть выполнены предположения А.3, А.7 и А.8.
Тогда, если множество ?, определяемое выражением (11), не пусто,
то решение задачи стимулирования определяется выражениями (7)
и (10), если ? = ?, то решение задачи стимулирования определяет-
ся выражениями (12)-(15).

1
Напомним, что выше мы условились в случае отсутствия равновесия
Нэша считать равновесными те стратегии центров, которые устойчи-
вы в смысле "условия угроз" (см. раздел 2.2.2).
79
В предельных случаях теорема 20 переходит: при nf=1 - в след-
ствие 12, при k=1 - в теорему 17, при nf=1 и k=1 - в теорему 7.


2.5. ОБЩАЯ МОДЕЛЬ ОРГАНИЗАЦИОННОЙ СИСТЕМЫ
С РАСПРЕДЕЛЕННЫМ КОНТРОЛЕМ (МОДЕЛЬ РК12)
r
В общей модели ОС РК (модель РК 12 - ?РК12 = {nA ? 2, f ,
r
k ? 2, u } - см. рисунок 5) имеют место одновременно все характер-
ные для распределенного контроля признаки: агент имеет вектор-
ные предпочтения на многомерном множестве своих допустимых
действий, а несколько центров совместно выбирают векторные
управления. Поэтому все остальные базовые модели ОС РК, опи-
сываемые в настоящей работе могут рассматриваться как частные
случаи этой модели.
В то же время, для модели РК 12 справедливы все результаты,
полученные в разделе 2.4.4 для модели РК 16 (см. теорему 20), так
как при исследовании последней не предполагалась скалярность
множества допустимых действий агента, поэтому дублировать
рассуждения мы не будем, а перейдем к обсуждению межуровнево-
го взаимодействия участников многоуровневых организационных
систем.




80
3. СЕТЕВЫЕ СТРУКТУРЫ УПРАВЛЕНИЯ

Во втором разделе настоящей работы описаны базовые модели
двухуровневых организационных систем с распределенным кон-
тролем. Результаты проведенного исследования позволяют сделать
вывод, что в ОС РК присутствуют две характерные черты, отли-
чающие их от систем с унитарным контролем: наличие игры цен-
тров (см. описание модели РК 3) и векторных предпочтений аген-
тов1 (см. описание модели РК 14).
Одним из показателей, по которым описывается ОС, является
структура ОС - совокупность информационных, управляющих и
других связей между участниками ОС, включая отношения подчи-
ненности и распределение прав принятия решений [59]. Совокуп-
ность приведенных выше результатов анализа теоретико-игровых
моделей ОС РК (то есть задач синтеза оптимальных управлений в
ОС с заданной структурой) позволяет сравнивать эффективности
различных структур и, следовательно, переходить к изучению задач
синтеза оптимальных структур. Поэтому настоящий раздел посвя-
щен в основном анализу сравнительных эффективностей различ-
ных структур управления организационными системами.
Во введении были выделены линейные (см. рисунок 1), мат-
ричные (см. рисунок 2) и сетевые структуры управления (см. рису-
нок 3). Более корректно, под линейной структурой понимается
такая структура, при которой подчиненность участников ОС имеет
вид дерева, то есть каждый участник подчинен одному и только
одному участнику более высокого уровня иерархии2. Двухуровне-
вой ОС с линейной структурой соответствует модель РК 1 (см.
раздел 2.1), модели многоуровневых ОС с линейными структурами
подробно исследовались в монографии [59].
Под матричной структурой понимается такая структура, при
которой некоторые участники ОС могут быть подчинены одновре-

1
Так как наличие векторных предпочтений агента не изменяет принци-
пиально структуру решения (см. описание моделей РК 3 и РК 16), то
ограничимся в дальнейшем случаем скалярных предпочтений.
2
Следует отметить, что в подавляющем большинстве работ, содер-
жащих формальные модели управления организационными системами,
рассматривались модели ОС, характеризуемые именно древовидными
структурами.
81
менно нескольким, находящимся на одном и том же (следующем
более высоком) уровне иерархии участникам (так называемое
двойное подчинение [59] - см. рисунок 2). Двухуровневой ОС с
матричной структурой соответствуют модель РК 16. Межуровневое
взаимодействие [59], понимаемое как подчинение некоторых уча-
стников одновременно нескольким участникам, находящимся на
различных уровнях иерархии, в ОС с матричной структурой отсут-
ствует.
Сетевой структурой управления называется такая структура
управления ОС (см., например, рисунок 3), при которой могут
иметь место и двойное подчинение, и межуровневое взаимодейст-
вие, причем одни и те же субъекты могут выступать как в роли
управляющих органов, так и в роли агентов1.
Последующее изложение материала настоящего раздела имеет
следующую структуру. Сначала в разделе 3.1 кратко обсуждаются
полученные в [59] результаты анализа межуровневого взаимодей-
ствия в отсутствии двойного подчинения, затем в разделе 3.2 ис-
следуется ромбовидная структура управления (см. рисунок 3),
являющаяся элементом сетевой структуры управления, и, наконец,
в разделе 3.3 описывается сетевое взаимодействие, в рамках кото-
рого могут изменяться роли участников ОС.


3.1. Межуровневое взаимодействие

В [59] рассматривались механизмы стимулирования и плани-
рования в трехуровневых организационных системах, структура
подчиненности в которых имела вид дерева (центр верхнего уров-

1
Следует сделать следующее терминологическое замечание. Под сетевой
структурой в некоторых работах понимается иерархическая структура,
в которой имеется двойное подчинение (нарушение "древовидности"), в
других работах под сетевой структурой понимается такой способ
организации взаимодействия участников системы, при котором отсут-
ствует ярко выраженная иерархия (то есть подразумевается, что
одноуровневая сеть является "противоположностью" многоуровневому
дереву). Предложенное выше определение охватывает оба толкования
как частные случаи, рассматриваемые соответственно в разделах 3.2 и
3.3.
82
ня, центры промежуточного уровня и агенты на нижнем уровне
иерархии), то есть каждый агент был подчинен одному и только
одному центру промежуточного уровня, а каждый центр промежу-
точного уровня был подчинен единственному центру. Как правило,
говоря об иерархии, неявно имеют в виду именно древовидную
структуру.
Понятно, что в реальных многоуровневых организационных
системах может иметь место более сложная структура подчиненно-
сти, в частности конкретный агент может быть непосредственно
подчинен как некоторому центру промежуточного уровня, так и
центру верхнего уровня. Обсудим, следуя в основном [59], эффек-
ты, связанные с "нарушениями иерархичности", то есть проявления
межуровневого взаимодействия участников ОС.
Одним из возможных "нарушений иерархии" является наличие
двойного межуровневого подчинения, когда один агент или про-
межуточный центр подчинен одновременно двум или более управ-
ляющим органам, находящимся на различных уровнях иерархии.
Пример структуры подчиненности, соответствующий этому слу-
чаю, приведен на рисунке 10 (А2i подчинен одновременно центру и
i-му промежуточному центру).
Пусть в трехуровневой ОС центр имеет полную информацию о
моделях несвязанных агентов, то есть агрегирование информации
отсутствует. Предположим, что центр верхнего уровня, имея в
своем распоряжении фонд заработной платы (ФЗП), может некото-
рую его часть использовать на стимулирование промежуточных
центров, а остаток - на стимулирование непосредственно агентов.
Таким образом, задача стимулирования заключается в распределе-
нии ФЗП, то есть - в определении оптимального соотношения
между частью ФЗП, передаваемой промежуточным центрам (и
используемой последними на выплаты агентам), и частью ФЗП,
используемой центром непосредственно на стимулирование аген-
тов нижнего уровня. Стимулирование агентов центром является
проявлением межуровневого взаимодействия (нарушением принци-
па единоначалия, то есть древовидной структуры подчиненности) и
обозначено на рисунке 10 жирной линией.




83
Метасистема




Центр i -я подсистема




••• •••
Ц1 Ц2 Цi Цn

••• •••
•••


••• •••
А1i А2i Аmi Аni i


Рис. 10. Пример двойного межуровневого подчинения

Качественно, в рассматриваемой модели происходит "деком-
позиция" множества реализуемых действий агентов, которая соот-
ветствует разделению ресурса центра на две части, расходуемые на
непосредственное стимулирование агентов и стимулирование
промежуточных центров. Можно сделать вывод, что для любого
размера ФЗП эффективность стимулирования в случае межуровне-
вого взаимодействия не выше, чем в случае линейной структуры
управления, в рамках которой весь ресурс расходуется центром на
стимулирование промежуточных центров, следовательно, опти-




84
мальным является использование всего ФЗП на стимулирование
промежуточных центров1.
В рассматриваемой модели все управляющие органы обладают
достаточной свободой в принятии решений (распределении фондов
стимулирования и т.д.). Если в некоторой организационной системе
зафиксировано такое разграничение функций управления, при
котором центры промежуточного уровня обязаны в точности вы-
полнять все исчерпывающие решения центра верхнего уровня
(например, приказы в армии), то возможно, что двойное межуров-
невое подчинение агентов и не приведет к снижению эффективно-
сти управления. Примером здесь также может служить распростра-
ненное на практике целевое финансирование, при котором статьи и
объемы расходования средств, получаемых, например, Цj от центра,
строго фиксированы. Использование подобных жестких принципов
управления фактически соответствует полному прямому подчине-
нию агентов центру верхнего уровня.
В [59] доказано, что, если экономический фактор отсутствует,
то эффективность стимулирования в трехуровневой ОС не выше,
чем в соответствующей двухуровневой. Выше мы показали, что в
трехуровневой ОС "двойное подчинение" агентов центрам разных
уровней иерархии не увеличивает эффективности по сравнению с
"прямым" подчинением. Эти результаты были получены при пред-
положении, что агрегирование информации отсутствует. Если
имеет место агрегирование информации и/или информационный
фактор, то эффективность стимулирования при введении косвенно-
го подчинения тем более не возрастет. Содержательно, это связано
с тем, что, как правило, в многоуровневых системах центр инфор-
мирован о моделях агентов не лучше, чем центры промежуточного
уровня.
Следовательно, если производится децентрализация двухуров-
невой ОС (или в более общем случае в многоуровневой ОС вводят-
ся дополнительные промежуточные уровни управления), то в ряде
случаев целесообразна "развязка" управления между уровнями -
непосредственное управление "через уровень" может оказаться
1
Интересно отметить, что сделанный вывод на первый взгляд неочеви-
ден для случая влияния экономического фактора, отражающего привне-
сение промежуточными центрами собственных ресурсов управления
[59].
85
неэффективным. Другими словами, в рассматриваемых моделях то,
чего может "добиться" от агентов центр, может "добиться" от них с
не большими затратами и их непосредственный "начальник" -
промежуточный центр, если последний будет обеспечен соответст-
вующим ресурсом1.
Итак, в рассмотренных моделях двойное подчинение агента
управляющим органам, находящимся на различных уровнях иерар-
хии, оказывается неэффективным. Косвенным подтверждение этой
неэффективности является известный управленческий принцип
"вассал моего вассала - не мой вассал". Поэтому с нормативной
точки зрения каждый агент должен быть непосредственно подчи-
нен только своему непосредственному "начальнику" - управляю-
щему органу, находящемуся на следующем (и только на следую-
щем) более высоком уровне иерархии.
Возникает закономерный вопрос: почему в реальных организа-
ционных системах наблюдаются эффекты двойного межуровневого
подчинения? Дескриптивное (без учета нормативной структуры
взаимодействия участников и институциональных ограничений)
объяснение таково. Обычно (в том числе и выше) предполагается
[7, 28, 36, 59, 48, 49], что потери эффективности могут возникать
только из-за факторов агрегирования, декомпозиции задач управ-
ления и недостаточной информированности центра о моделях
агентов. Если же присутствуют, в частности, информационные
ограничения на промежуточном уровне - например, количество
информации, которое должен переработать управляющий орган
некоторой подсистемы, превосходит его возможности - то часть
функций управления (быть может, в агрегированном виде) вынуж-
денно передается на более высокий уровень. Проще говоря, основ-
ной причиной наблюдаемого на практике двойного межуровневого
подчинения, как правило, является некомпетентность (в объектив-
ном, а не негативном, смысле этого слова) промежуточного центра.
Поэтому, с одной стороны, при решении задач синтеза организаци-
1
Другим примером являются рассмотренные в [59] механизмы планиро-
вания, допускающие произвольную децентрализацию (анонимные меха-
низмы распределения ресурса, механизмы экспертизы, механизмы от-
крытого управления с внутренними ценами и др.). В упомянутых моделях
структура целевых функций агентов такова, что они идентичны в двух-
уровневой и соответствующей ей многоуровневой ОС.
86
онной, функциональной, информационной и других структур ОС
априори следует допускать возможность двойного подчинения,
стремясь, тем не менее, избежать его насколько это возможно. С
другой стороны, наличие двойного межуровневого подчинения в
реальной организационной системе косвенно свидетельствует о
неоптимальности ее функционирования и должно послужить руко-
водителю сигналом о необходимости пересмотра структуры, а
иногда и состава, системы.
Таким образом, с нормативной точки зрения в описанных мо-
делях нарушение принципа единоначалия, как и присутствие двой-
ного межуровневого подчинения (см. выше), не увеличивает эф-
фективности управления. С дескриптивной точки зрения,
наблюдаемые на практике его нарушения, обусловлены "некомпе-
тентностью" соответствующих управляющих органов в рамках
заданного элементного состава, функциональных, информацион-
ных и других связей, а также внутренних (индивидуальных) и
внешних ограничений на управление.
С другой стороны, как показывает проведенный анализ, при
решении задач синтеза структуры и/или механизмов управления
ОС не следует специально концентрировать внимание на эффектах
двойного подчинения - их наличие или отсутствие является автома-
тическим следствием грамотной постановки задачи управления и
корректного ее решения с учетом всей специфики многоуровневых
организационных систем - экономического, информационного,
организационного и других факторов [59].
Отсутствие двойного подчинения (в широком смысле - как од-
новременного подчинения нескольким управляющим органам
одного или различных уровней) достаточно привлекательно с точки
зрения анализа системы - в этом случае веерная структура ОС
позволяет декомпозировать ее на набор базовых двухуровневых
веерных ОС, результаты исследования которых, получаемые с
применением всего многообразия известных методов, разрабаты-
ваемых до сих пор в основном именно для двухуровневых ОС,
могут быть эффективно использованы на этапе синтеза как струк-
туры ОС, так и механизмов управления.
В заключение настоящего раздела отметим, что выше мы рас-
сматривали в основном отрицательные проявления нарушения
принципа единоначалия. Поэтому для полноты картины необходи-
87
мо хотя бы качественно определить те случаи, помимо упомянутых
выше (информационная нагрузка, компетентность и др.), в которых
наличие распределенного контроля приводит к росту эффективно-
сти управления.
Первым и достаточно ярким, как с теоретической точки зре-
ния, так и исходя из опыта практического использования, примером
является класс многоканальных механизмов управления, то есть
механизмов, в которых управляющие воздействия вырабатываются
несколькими (как правило, двумя) параллельно функционирующи-
ми каналами управления (принятия решений). Содержательно,
высокая (по сравнению с одноканальными) эффективность функ-
ционирования многоканальных систем, особенно в условиях неоп-
ределенности, обусловлена тем, что эффективности решений,
предлагаемых управляющими органами, в различных условиях
функционирования также различны [1, 16, 22, 25].
Во-вторых, следует подчеркнуть, что выводы, сформулирован-
ные в [59], были получены для моделей многоуровневых ОС, в
которых управляемыми параметрами являются скалярные (одно-
мерные) величины - действия агентов. В частности, при исследова-
нии межуровневого взаимодействия вывод о неэффективности
двойного межуровневого подчинения был сделан именно для "ска-
лярных" агентов1. Содержательно, рассматривалось управление
некоторым конкретным аспектом деятельности каждого агента.
Понятно, что в реальных организационных системах деятельность
управляемого субъекта не всегда может быть описана единствен-
ной переменной (см. модели ОС с векторными предпочтениями
агентов во втором разделе). Следовательно, результат настоящего
раздела более корректно может быть сформулирован следующим
образом: в ряде случаев "двойное" управление одними и теми же
аспектами деятельности не эффективно (более того, в большинст-
ве случаев дублирование управления вредно).
1
Если перейти от одномерной модели ОС, для которой именно линейная
иерархическая (древовидная) структура системы управления имеет
максимальную эффективность, к многомерной модели, то получим столь
распространенную на практике "векторную" матричную (или, в более
общем случае - сетевую) структуру, состоящую из параллельно функцио-
нирующих (и в общем случае - взаимодействующих) древовидных струк-
тур, «замкнутых» на один субъект управления.
88
3.2. Ромбовидная структура управления

Выше при рассмотрении двухуровневой ОС РК с несколькими
центрами было установлено, что в игре центров в зависимости от
степени согласованности их интересов существуют два режима -
режим сотрудничества и режим конкуренции. Исследуем соотно-
шения выигрышей центров (значений их целевых функций) в этих
двух режимах.
Режим сотрудничества имеет место, когда непусто множество
? равновесий Нэша, задаваемое следующей системой неравенств:
? ?i = c(y*),
(1)
i?K
i
(2) Hi(y*) - ?i ? Wmax , i ? K.
Существенным преимуществом режима сотрудничества явля-
ется его высокая эффективность (в смысле эффективности по Паре-
то результирующего вектора значений целевых функций центров).
Недостатком режима сотрудничества является наличие большого
числа равновесий Нэша (см. в качестве иллюстрации примеры 2 и
4), приводящее с точки зрения исследователя операций к неопреде-
ленности относительно конечного состояния ОС. Неопределен-
ность присутствует также и с точки зрения центров, так как в
рамках введенных предположений относительно информированно-
сти участников организационной системы и порядка ее функцио-
нирования при моделировании необходимо доопределять принци-
пы рационального поведения центров1 - процедуры выбора ими
стратегий из числа равновесных по Нэшу (смешанное равновесие
Нэша в рассматриваемом классе задач существует крайне редко
[59, 86]). Поэтому даже в режиме сотрудничества наличие метацен-
тра, выполняющего лишь информационные функции, например -
рекомендующего выбор конкретного равновесия Нэша, может
повысить эффективность функционирования ОС за счет снижения
неопределенности и информационной нагрузки на центры (см.
также обсуждение информационного фактора и фактора неопреде-
1
Ситуация может упрощаться (с точки зрения принципов принятия
решений центрами, но не с точки зрения исследователя операций) при
допущении кооперативного взаимодействия центров (см. обсуждение в
разделе 2.2.2, а также лемму 21).
89
ленности в [59, 62]). Кроме того, метацентр имеет возможность
сознательно управлять равновесием в играх центров и агентов и
максимизировать агрегированный критерий функционирования
организационной системы в целом, быть может, посредством ис-
пользования системы компенсаций для управляемых субъектов (см.
ниже).
Пусть множество ? пусто, то есть не существует решения сис-
темы неравенств (1)-(2). Тогда имеет место режим конкуренции,
аукционному решению в котором соответствует вектор
r
(3) ? ' = (c( y1 ) + Wmax + ?, 0, …, 0).
2
max
Вектор значений целевых функций центров при этом равен:
r'
(4) W = ( Wmax - Wmax - ?, H2( y1 ), …, Hk( y1 )).
1 2
max max
Вектор (3) не удовлетворяет условиям (2) и не является равно-
весием Нэша, так как первый центр при неизменных стратегиях
остальных центров может уменьшить выплаты агенту не изменяя
при этом реализуемого действия1. По этим же причинам можно
утверждать, что решение в режиме конкуренции не может домини-
ровать по Парето ни одно из решений, получаемых в режиме со-
трудничества.
Итак, недостатки режима конкуренции очевидны, однако для
возможности "перехода" от конкуренции к сотрудничеству необхо-
димо введение дополнительных предположений о свойствах рас-
сматриваемой модели. Эти предположения можно условно разде-
лить на две группы: "внутренние" изменения и "внешние"
изменения.
"Внутренние" изменения. Предположения относительно
"внутренних" параметров модели касаются, в первую очередь,
способности центров образовывать коалиции, то есть обмениваться
информацией, заключать договоренности и обмениваться полезно-
стью в соответствии с этими договоренностями (см. также обсуж-
дение в разделе 2.2.2).




Отметим, что любое решение из множества ? устойчиво относитель-
1

но "угроз", так диктатор, переходя в режим конкуренции, не может
увеличить значение своей целевой функции.
90
Обозначим сумму функций дохода центров
? H i ( y)
(5) H(y) =
i?K
и рассмотрим максимальную коалицию (то есть коалицию, вклю-
чающую все центры) с целевой функцией
(6) W(y) = H(y) - c(y).
Обозначим ymax = arg max W(y) - действие агента, максимизи-
y? A
рующее целевую функцию коалиции, Wmax = W(ymax) - максималь-
ное значение целевой функции W(y).
Пусть ti - положительный, отрицательный или нулевой платеж,
получаемый i-ым центром от коалиции. Условие сбалансированно-
сти платежей имеет вид:
? ti
(7) = 0.
i?K
Примем следующее предположение относительно рациональ-
ного поведения центров: будем считать решением кооперативной
игры центров такой вектор их допустимых стратегий, реализующих
действие ymax (то есть максимизирующих суммарный выигрыш
коалиции) и сбалансированных платежей, которые удовлетворяют
условиям индивидуальной рациональности:
i
(8) Hi(ymax) - ?i + ti ? Wmax , i ? K.
r
Лемма 21. Если ? ? ?, то ? ( ?max , ymax) ? ?.
r
Доказательство. Пусть (y , ? ) - некоторая точка, принадлежа-
*

˜
щая множеству ?. Определим ? i = Hi(ymax) - Hi(y*) + ?i, i ? K.
После несложных преобразований получаем, что
˜
? ? i = H(ymax) - H(y*) + c(y*) = c(ymax) + W(ymax) - W(y*) ? c(ymax).
i?K
˜
Следовательно система платежей { ? i } позволяет компенсиро-
вать агенту затраты по выбору действия ymax. Компоненты вектора
r ˜
?max могут быть выбраны меньшими соответствующих ? i таким
? ?i max = c(ymax). •
образом, чтобы обеспечить выполнение
i?K

91
Следствие 22. В режиме сотрудничества возможность образо-
вания коалиции центров не снижает эффективности (в смысле
Парето) управления.
Другими словами, из леммы 21 следует, что для любого реше-
ния задачи (1)-(2) существует соответствующее решение задачи
? ?i = c(ymax), (7), (8) не меньшей эффективности.
i?K
Из леммы 21 также следует, что если соответствующее со-
трудничеству равновесие Нэша в игре центров существует, то
одним из равновесий является вектор платежей, реализующий
действие ymax, то есть максимизирующий сумму целевых функций
центров.
? Wmax
i
Следствие 23. Условие Wmax ? является необходимым
i?K
условием непустоты области ?.
Доказательство. Пусть область ? непуста. Тогда по лемме 21
r
? ( ?max , ymax) ? ?. Запишем систему неравенств, задающую об-

? ?i i
ласть ?, для y = ymax: = c(ymax), Hi(ymax) - ?i ? Wmax , i ? K.
i?K
Суммируя последние k неравенств с учетом первого равенства
получаем утверждение следствия. •
? Wmax )
i
Содержательно величина (Wmax - может рассматри-
i?K
ваться как "интегральная" мера согласованности интересов цен-
тров.
"Внешние" изменения. Предположения относительно "внеш-
них" параметров модели касаются, в первую очередь, изменений
состава и структуры ОС - введению дополнительного уровня ие-
рархии, то есть метаигрока, наделенного властью устанавливать
правила игры участников ОС, принадлежащих нижележащим
уровням иерархии.
Рассмотрим ромбовидную структуру управления трехуровне-
вой ОС, состоящей из одного управляющего органа - метацентра -
на верхнем уровне иерархии, k центров на промежуточном уровне,
и одного агента на нижнем уровне иерархии. Метацентр имеет

92
возможность использовать управления двух типов - институцио-
нальное управление и мотивационное управление.
Институциональное управление соответствует запрещению
или разрешению тех или иных ситуаций, стратегий и т.д. Напри-
мер, пусть метацентр установил достаточно сильные штрафы за
использование "угроз" в режиме конкуренции. Тогда, даже если
равновесия Нэша в игре центров не существует, устойчивым (и в
смысле "угроз", которые запрещены, и в смысле Нэша) является
следующее решение:
r ''
(9) ? = (c( y1 ), 0, …, 0),
max
то есть диктатор самостоятельно компенсирует затраты агенту, не
переплачивая из-за боязни "угроз". Соответствующий решению (9)
вектор значений целевых функций центров
r
(10) W '' = ( Wmax , H2( y1 ), …, Hk( y1 ))
1
max max
r
доминирует по Парето вектор W '. Выигрыш (в смысле разности
сумм значений целевых функций центров) от перехода от тре-
2
угольной к ромбовидной структуре управления составляет Wmax .
Разница между последней величиной и затратами на "содержание"
метацентра может рассматриваться как оценка эффективности его
управления и, следовательно, как критерий целесообразности
введения новой структуры управления.
Таким образом, условием осуществления институционального
управления, заключающегося в использовании штрафов или поощ-
рений центров, зависящих от стратегий последних, является нали-
чие у метацентра соответствующих полномочий.
Мотивационное управление. Если институциональное управ-
ление основывалось на использовании метацентром стратегий,
зависящих от стратегий центров, то мотивационное управление
заключается в использовании им стратегий, зависящих от действий
агента, то есть изменению целевых функций центров посредством
их стимулирования за деятельность управляемого ими агента.
Пусть метацентр заинтересован в максимизации функции W(y)
(см. выражение (6)) и использует систему {?i(y)}i?K стимулирова-
ния центров. Целевая функция i-го центра при этом имеет вид:
Wi(y) = ?i(y) + Hi(y) - ?i(y), i ? K.

93
Затраты метацентра на управление складываются из стимули-
рования центров и стимулирования непосредственно агента1 ?0(y),
то есть ?0(y) = ? ? i ( y) + ?0(y).
i?K
Таким образом, задача метацентра состоит в минимизации
(выбором системы стимулирования) затрат ?0(y) на управление при
условии обеспечения реализуемости действия агента, максимизи-
рующего сумму целевых функций центров, равновесными по Нэшу
стратегиями центров2.
Теорема 24. Решение задачи управления в трехуровневой ОС с
ромбовидной структурой имеет вид:
?max{Wmax ? H i ( y max ); 0}, y = y max
i
(11) ?i(y) = ? , i ? K,
y ? y max
? 0,
?c( y max ) ? ? max{H i ( y max ) ? Wmax ; 0}, y = y max
i
?
(12) ?0(y) = ? .
i? K
?0, y ? y max
?
Справедливость утверждения теоремы 24 обосновывается под-
становкой (11)-(12) в определение равновесия Нэша игры центров
(минимальность платежей очевидна):
? ?i = c(ymax) - ?0(ymax),
(13)
i?K
i
(14) Hi(ymax) - Wmax + ?i(ymax) ? ?i, i ? K.
Содержательно, метацентр разделяет центры на два множест-
ва. В первое множество входят центры, которым невыгодна (с
точки зрения условий их индивидуальной рациональности) реали-
зация действия ymax. Этим центрам метацентр компенсирует потери
в полезности. Во второе множество входят центры, которым вы-
годна реализация действия ymax. Они частично или полностью


1
Отметим, что в рассматриваемой модели имеет место двойное межу-
ровневое взаимодействие (см. выше), так как агент получает вознаграж-
дения как от центров, так и от метацентра.
2
Эта и подобные задачи являются традиционными задачами, возникаю-
щими при управлении холдингами, вертикально интегрированными ком-
паниями и т.д.
94
компенсируют затраты агента, а разность доплачивает метацентр в
рамках межуровневого взаимодействия.
Пример 5. Пусть в рамках примера 3 возможно введение до-
полнительного уровня управления - метацентра.
Итак, пусть k = 2, c(y) = y2, H1(y) = ? - ?1y, H2(y) = ?2 y, то есть
первый центр заинтересован в выборе агентом минимального
(нулевого) действия, а второй центр - некоторого действия, отлич-
ного от нуля. Так как интересы центров не согласованы, то имеет
место режим конкуренции (см. подробности в примере 3).
y1 = 0, 2
y max = ?2/2,
Вычислим следующие величины: max
1 2
Wmax = ?, Wmax = (?2)2/4, ymax = max {(?2 - ?1)/2; 0}, = ? - ?1 (?2 -
?1)/2, H2(ymax) = ?2 (?2 - ?1)/2.
1
Пусть для определенности ?2 ? 2?1. Тогда Wmax ? H1(ymax),
2
Wmax ? H2(ymax). Вычисляя в соответствии с результатом теоремы
24 равновесные платежи, получим:
?1 = 0, ?2 = ?2(?2 - 2?1)/4, ?0(ymax) = (?1)2/4.
Сравним эффективности управления. В режиме конкуренции,
когда диктатором является первый центр (а это имеет место при
? ? (?2)2/4), эффективность равна
W( y1 ) = ? - (?2)2/4.
max
В трехуровневой ОС эффективность управления (с учетом за-
трат метацентра на стимулирование) равна
W(ymax) - ?0(ymax) = ? - (?1)2/4 - (?2 - ?1)2/4.
Вычисляем разность эффективностей
W(ymax) - ?0(ymax) - W( y1 ) = ?1 ?2 / 2,
max
которая неотрицательна, что позволяет сделать вывод, что дости-
жение режима сотрудничества за счет введения дополнительного
уровня управления в рассматриваемой ОС оправданно. •


3.3. Сетевое взаимодействие

Как отмечалось во введении к третьему разделу, под сетевой
структурой управления обычно понимается либо иерархическая
95
структура, в которой имеется двойное подчинение, либо такой
способ организации взаимодействия участников системы, при
котором отсутствует ярко выраженная иерархия, то есть когда все
участники ОС априори "равны" и каждый из них в общем случае
может вступать в сетевое взаимодействие с другими участниками
ОС и выступать в нем как в качестве центра, так и в качестве аген-
та.
В разделе 3.2 исследовалась трехуровневая ромбовидная
структура управления, являющаяся элементом сетевой иерархиче-
ской структуры с двойным подчинением. В настоящем разделе
исследуются неиерархические сетевые структуры, то есть делается
акцент на анализе сетевого взаимодействия.
Так как характерным признаком сетевого взаимодействия яв-
ляется потенциальная возможность каждого из участников ОС
выступать в роли центра или агента, или одновременно и в роли
центра, и в роли агента (при взаимодействии с различными участ-
никами), то исследуем сначала качественно, а затем на примере
ряда последовательно усложняющихся количественных моделей
различие между этими "ролями".
Качественное отличие иерархических игр от "обычных" неанта-
гонистических игр заключается в наличии упорядочения участни-
ков ОС по последовательности выбора стратегий. Обычно считает-
ся, что управляющий орган (центр в теории активных систем
[23, 61], первый игрок в теории иерархических игр [31], principal в
теории контрактов [83, 84, 87]) обладает правом первого хода, то
есть выбирает свою стратегию первым и сообщает ее другим уча-
стникам системы - управляемым субъектам (активным элементам
или агентам в теории активных систем, второму игроку или произ-
водителю в теории иерархических игр, agent в теории контрактов).
В зависимости от того, может ли первый игрок рассчитывать
на то, что ему станет известна стратегия второго игрока, он может
выбирать свою стратегию либо как в "обычной" игре, либо в виде
«функции» от выбора второго игрока. Тем самым, первый игрок
превращается в метаигрока, устанавливающего "правила игры" для
остальных игроков (проявление отношения власти [48, 59]). Таким
образом, критерием отнесения конкретного участника ОС ко
множеству управляющих органов или ко множеству управляе-
мых субъектов является его приоритет в последовательности
96
выбора стратегий и возможность выбирать в качестве своей
стратегии «функцию» от стратегий игроков, имеющих более
низкий приоритет.
Например, если в некоторой ОС участники принимают реше-
ния последовательно и имеются три "момента" принятия решений,
то можно условно рассматривать данную ОС как трехуровневую
иерархическую систему. Участники, делающие первый ход, при
этом интерпретируются как центры верхнего уровня иерархии,
участники, делающие второй ход, интерпретируются как центры
промежуточного уровня, а участники, выбирающие свои стратегии
последними - управляемыми субъектами (агентами). Стратегии
центров могут быть функциями от стратегий центров промежуточ-
ного уровня и агентов, стратегии центров промежуточного уровня -
функциями от стратегий агентов. Следовательно, в рамках теорети-
ко-игровой модели иерархическая структура ОС порождается
фиксацией последовательности выбора стратегий и информирован-
ности участников.
Таким образом, в процессе сетевого взаимодействия каждый из
участников в общем случае может выступать как в роли центра
того или иного уровня иерархии, так и в роли агента. Фактическая
роль участника определяется двумя факторами. Первый фактор
заключается во влиянии имеющегося отношения власти, то есть
институциональной возможности определенного участника высту-
пать в той или иной роли. Второй фактор заключается в целесооб-
разности (эффективности, в том числе и экономической) этой роли
как с точки зрения самого участника, так и с точки зрения других
участников.
Фиксируем экзогенно заданное отношение власти и рассмот-
рим эффективность различных распределений ролей между участ-
никами ОС. Другими словами, исследуем следующую модель.
Имеются несколько игроков (участников ОС), каждый из которых
может выбирать свои стратегии в определенные моменты времени
и в зависимости от принятой последовательности выбора стратегий
делать свою стратегию зависящей от стратегий участников, выби-
рающих стратегии после него. Получаем метаигру1 - игру, в кото-
1
В [31] метаиграми названы игры с фиксированной последовательно-
стью ходов, в которых стратегии одних игроков могут быть
“функциями” от стратегий других игроков.
97
рой определяются роли участников (будем считать, что их выиг-
рыши при каждом фиксированном распределении ролей могут
быть вычислены). Следовательно необходимо описать и исследо-
вать равновесия в этой метаигре, чем мы и будем заниматься в
оставшейся части настоящего раздела для нескольких содержа-
тельно интерпретируемых задач.
Первым и достаточно ярким примером является задача стиму-
лирования (см. также [30, 31, 46, 62]).
Пример 6. Пусть ОС состоит из двух участников - "центра" и
"агента"1, имеющих целевые функции
(1) W(z, y) = H(y) - z,
(2) w(z, y) = z - c(y)
соответственно (см. раздел 2.1). Стратегией центра в задаче стиму-
лирования (являющейся игрой типа Г2 с побочными платежами и
специфическим видом целевых функций) является выбор положи-
тельнозначных функций от стратегий агента, стратегией агента -
выбор неотрицательных действий.
Пусть выполнено предположение А.2 и гипотеза благожела-
тельности. Рассмотрим последовательно несколько возможных игр
между центром и агентом.
Игра Г0. Рассмотрим "обычную" некооперативную игру, в ко-
торой центр и агент выбирают свои стратегии одновременно и
независимо. Обозначим эту игру Г0. Так как центр не имеет воз-
можности наблюдать реализацию выбора агента, то он вынужден
ограничиться выбором неотрицательного числа (а не функции от
действия агента, как это имеет место в случае, когда центр делает
первый ход и рассчитывает на знание действия агента).
Из выражений (1) и (2) следует, что в игре Г0 равновесиями
Нэша агента и центра является выбор нулевых значений действий и
вознаграждений соответственно. Таким образом, равновесные
стратегии2: z0 = 0, y0 = 0, а выигрыши участников: W0 = 0, w0 = 0.


1
Так как мы будем рассматривать всевозможные последовательности
ходов и варианты информированности, то термины "центр" и агент"
введены для идентификации участника ОС по виду его целевой функции
(см. выражения (1) и (2)).
2
Условимся, что нижний индекс соответствует номеру рассматривае-
мой игры.
98
Игра Г1. Предположим теперь, что центр обладает правом
первого хода, но не может рассчитывать на знание выбора агента.
Поэтому он вынужден, как и в игре Г0, ограничиться выбором
неотрицательного числа. Отличие игры Г1 от игры Г0 заключается в
том, что в ней центр выбирает свою стратегию первым и сообщает
ее агенту, а агент выбирает свое действие при известной ему стра-
тегии центра.
Легко видеть, что наличие права первого хода у центра не ме-
няет исхода: при любой стратегии центра агент выбирает нулевое
действие как действие, минимизирующее затраты. Поэтому опти-
мальной стратегией центра будет нулевое поощрение. Итак:
z1 = 0, y1 = 0, W1 = 0, w1 = 0.
Игра Г* . Если изменить имеющую место в игре Г1 последова-
2
тельность выбора стратегий на противоположную, то получим
игру1 Г* , в которой агент первым выбирает стратегию и сообщает
2
ее центру (при этом считается, что стратегия центра всегда стано-
*
вится известной агенту; в противном случае получим игру Г1 ,
решение которой для рассматриваемого примера совпадает с реше-
нием игры Г1). Содержательно центр получает от агента информа-
цию о зависимости действия, выбираемого агентом, от вознаграж-
дения, выплачиваемого ему центром.
Обозначим
*
(3) y = arg max {H(y) - c(y)},
y? A
(4) Q = H(y ) - c(y*).
*

Оптимальной стратегией агента будет стратегия
˜ ( z) = ? y , z = H ( y ) ,
* *
?
(5) y 2
?0, z ? H ( y )
*

побуждающая центр выбрать поощрение z = H(y*) и приводящая к
следующему вектору полезностей:
* *
W2 = 0, w2 = Q.

1
В соответствии с обозначениями теории иерархических игр [31] игра,
полученная из исходной переменой последовательности ходов, обознача-
ется звездочкой.
99
Игра Г2, в которой центр делает первый ход и, рассчитывая на
знание стратегии агента, выбирает свою стратегию в виде функции
от выбора агента, подробно исследовалась выше (см. раздел 2.1).
В этой игре оптимальны стратегии
˜ ( y ) = ? c( y ), y = y ; y2 = y*,
* *
?
(6) z2 = z 2
y ? y*
? 0,
которые приводят к следующему вектору выигрышей:
W2 = Q, w2 = 0.
Игра Г* . Если в игре Г2 первый ход делает агент, то получаем
3

игру Г* . Оптимальные стратегии агента и центра:
3
?*
˜ ( y ) = ? H ( y ), y = y
* *
? y , z = z3 ?
(7) ˜3 ( ˜( y )) = ? ˜
y* z *
y ? y * ; z3 = z3 ( y ) ,
? 0,
? 0, z ? ˜3 ( y )
? z
приносят им выигрыши
W3* = 0, w3 = Q.
*

Игра Г3, в которой стратегией агента является функция от вы-
бора центра, для рассматриваемого примера эквивалентна (в смыс-
ле равновесных выигрышей участников системы) игре Г2, то есть
W3 = Q, w3 = 0.
Рассматривать игры более высокого порядка не имеет смысла1.
Сводка результатов анализа различных игр2 для задачи стиму-
лирования приведена в таблице 2. Второй и третий столбцы содер-



1
Действительно, в [31] показано, что все нечетные игры, начиная с
третьей эквивалентны (в смысле гарантированного выигрыша первого
игрока) игре Г3, а все четные игры, начиная со второй, эквивалентны игре
Г2. Среди первых трех игр игра Г2 характеризуется максимальной эф-
фективностью, далее следует игра Г3, и, наконец, игра Г1.
2
Из рассматриваемой схемы "выпадает" распределение ролей, когда оба
игрока являются центрами и каждый пытается навязать другому игру
Г2 с правом собственного первого хода. Определить равновесие в такой
игре, не вводя дополнительных предположений, затруднительно. Можно
считать равновесием ситуацию, в которой один из игроков соглашается
100
жат равновесные выигрыши центра и агента в игре, соответствую-
щей строке.

Игра W w
Г0 0 0
0 0
*
Г1
Г1 0 0
0 Q
Г*
2
Г2 Q 0
0 Q
Г*
3
Г3 Q 0

Таблица 2. Равновесные выигрыши центра и агента
в задаче стимулирования

Таким образом, минимальными играми, описывающие все раз-
нообразие равновесных распределений выигрышей, являются игры
Г2 и Г* (в играх Г0, Г1 и Г1 выигрыши участников строго домини-
*
2
руются по Парето выигрышами в любой из игр второго порядка1, а
игры третьего и более высокого порядка приводят к тем же векто-
рам выигрышей).
Можно также заметить, что в играх второго порядка участники
ОС, фактически, определяют распределение между собой недели-
мого выигрыша Q – игрок, сделавший ход первым, забирает этот
выигрыш себе, вынуждая второго согласиться (в рамках гипотезы
благожелательности) на нулевое значение (см. также описание
задач найма на работу - так называемые модели рекрутинга [47] и
результаты исследования области компромисса в трудовых кон-
трактах [46]). Напомним, что областью компромисса называется
множество дележей z между центром и агентом, сумма которых


на второй ход. При этом реализуется одна из описанных выше игр Г2 или
*
Г2 .
1
Индекс i игры Гi иногда называется степенью игры или показателем
рефлексии.
101
равна Q, при использовании участниками стратегий (5) или (7), то
есть следующее множество:
(8) {z ? 0 | W(z, y*) + w(z, y*) = Q}.
Следовательно, при определении ролей в задаче стимулирова-
ния происходит борьба участников за первый ход. Если существу-
ют институциональные ограничения, определяющие последова-
тельность ходов, то роли распределяются однозначно. Такая
ситуация может иметь место, например, при найме агента на работу
в организацию, интересы которой представляет центр. Если на
рынке труда существует значительная конкуренция (то есть, если
имеется несколько претендентов на данную вакансию), то равнове-
сием среди претендентов является аукционное решение (в случае,
когда имеется много однородных агентов, в равновесии агент
получает нулевую (или резервную в рамках моделей теории кон-
трактов [20, 46, 86]) полезность). Если же на рынке имеется единст-
венный претендент (например, высококвалифицированный специа-
лист и т.д.), то он является "диктатором" и может сделать первый
ход, вынудив центр согласиться на нулевую полезность.
Отметим, что вектора полезностей участников ОС, соответст-
вующие играм Г2 и Г* , недоминируемы по Парето (что следует из
2
выражения (8)). Поэтому, пожалуй, единственной альтернативой в
этом случае является использование арбитражных схем (введение
третьей стороны - арбитра, определяющего роли участников и/или
дележи внутри области компромисса (8)), которые позволяют в
рамках существующих институциональных ограничений однознач-
но определить распределение ролей и, следовательно, полезностей.
В качестве арбитра в многоуровневой ОС может выступать управ-
ляющий орган, принадлежащий более высокому уровню иерархии
(см. также обсуждение системообразующей роли стимулирования в
[59]).
Помимо трудовых контрактов, содержательным примером
распределения ролей в соответствии с описанной выше схемой
могут служить механизмы обмена. Пусть, например, пассажир
хочет поймать такси, чтобы доехать до определенного места. Он
готов заплатить за это сумму a, а таксист готов ехать за вознаграж-
дение b. Очевидно, что, если b > a, то область компромисса пуста.
Взаимодействие возможно и взаимовыгодно (по сравнению с со-
хранением статус-кво) только если a ? b. При этом разность Q = a-b
102
определяет "размер" области компромисса. Если величины a и b
известны обоим игрокам1, то, если первым предложение делает
пассажир, то он называет цену таксиста и "экономит" Q, если же
первым предложение делает таксист, то он называет цену пассажи-
ра и "выигрывает" ту же величину Q. •
Другой показательный пример распределения ролей участни-
ков ОС дает сравнение игр Г0 и Г1.
Пример 7. Пусть имеются n агентов с целевыми функциями
fi(y), y = (y1, y2, …, yn) ? A = ? Ai , I = {1, 2, …, n}. Пусть EN -
i?I
множество равновесий Нэша, то есть
(9) EN = {yN ? A | ? i ? I, ? yi ? Ai fi( yiN , y ? i ) ? fi(yi, y ? i )},
N N

где y-i = (y1, y2, …, yi-1, yi+1, …, yn) - обстановка игры для i-го игрока,
i ? I.
Предположим, что существует соответствие отбора равновесий
[21, 61, 79], отображающее множество равновесий Нэша во множе-
ство A, то есть ставящее в соответствие множеству равновесий
конкретное равновесие. Обозначим это конкретное равновесие yN.
При определении равновесия Нэша предполагается, что игроки
выбирают свои стратегии одновременно и независимо. Рассмотрим
как повлияет на множество равновесий предположение о том, что
некоторые игроки обладают правом первого хода.
Если в исходной игре существует равновесие в доминантных
стратегиях (РДС), то есть у каждого игрока существует абсолютно
оптимальная (не зависящая от стратегий других игроков) стратегия
[23, 61, 86], то итоговое равновесие, очевидно, не будет зависеть от
последовательности ходов. Поэтому рассмотрим случай, когда РДС
не существует, но существует равновесие Нэша.
S ? I.
Фиксируем произвольное множество Пусть
yS ? AS = ? Ai - произвольный вектор равновесных по Нэшу
i?S
стратегий игроков из множества S, то есть:


1
Более сложные и реалистичные модели механизмов обмена, учитываю-
щие неполную информированность сторон о предпочтениях и возможно-
стях друг друга, рассмотрены в [83, 84].
103
? Ai : (yS; yI\S) ? EN;
(10) yS: ? yI\S ? AI\S =
i? I \ S
(11) EN(S) = {yS ? AS | ? yI\S ? AI\S: (yS; yI\S) ? EN}
- множество равновесных по Нэшу стратегий игроков из множест-
ва S.
Обозначим EN(yS) - множество равновесий Нэша, определяе-
мых равновесными по Нэшу стратегиями игроков из множества I\S
при условии, что игроки из множества S выбрали вектор стратегий
yS ? AS, удовлетворяющий (10), то есть
N
(12) EN(yS) = {y ? A | y = (yS; y I \ S ): ? i ? I\S, ? yi ? Ai
fi(yS, yiN , y I \ ( S ?{i}) ) ? fi(yS, yi, y I \ ( S ?{i}) ).
N N

Лемма 25. ? S ? I, ? yS ? EN(S) EN(yS) ? EN.
Справедливость утверждения леммы 25 следует из того, что,
если существует множество игроков S ? I и существуют вектор yS,
удовлетворяющий (11), и вектор yI\S, удовлетворяющий (12), то в
силу (10) вектор (yS; yI\S) должен принадлежать (9).
Содержательно лемма 25 гласит, что, если некоторое множест-
во агентов имеет право первоочередного хода, то, сообщая соответ-
ствующие компоненты равновесных по Нэшу стратегий, они могут
только сузить множество итоговых равновесий Нэша. Другими
словами, при фиксации части равновесных стратегий множество
равновесных стратегий других игроков не расширяется.
Следовательно, если исходное множество равновесий содер-
жит более одного элемента, и различным его элементам соответст-
вуют различные компоненты стратегий игроков из некоторого
множества, то игроки из этого множества, выбирая свои стратегии
первыми, могут сузить множество итоговых равновесий, то есть
побудить остальных игроков к выбору определенных равновесных
стратегий.
В качестве иллюстрации рассмотрим модель ОС, описанную в
примере 5 работы [63].




104
Рассмотрим ОС с двумя агентами, имеющими функции затрат
ci(yi) = yi2 /2ri, i = 1, 2. Пусть центр использует систему стимулиро-
вания
?Ci , y1 + y 2 ? x
?i(y1, y2) = ? , i = 1, 2.
0, y1 + y 2 < x
?
Содержательно центр выплачивает каждому агенту фиксированное
вознаграждение при условии, что сумма их действий оказывается
не меньше, чем некоторое плановое значение x. Обозначим Y –
множество индивидуально-рациональных действий АЭ:
yi+ = 2ri Ci , i = 1, 2, Y = {(y1, y2) | yi ? yi+ , i = 1, 2, y1 + y2 ? x}.
Рассмотрим следующую комби- y2
нацию переменных (см. рисунок x
11). Пусть множество равнове- N1
+
сий Нэша состоит из точки (0; 0) y2
и отрезка [N1 N2], то есть *
y2
EN(?) = (0; 0) ? [N1; N2],
причем точки интервала (N1; N2) N2
являются недоминируемыми по y1
Парето другими равновесиями, +
*
0 y1
y1 x
то есть:
Рис. 11
(N1; N2) = Par (EN(?), {fi}).
Первому агенту выгодно равновесие N1, второму - N2. Делая
+
ход первым, первый агент может выбрать действие (x - y 2 ), выну-
+
ждая второго агента выбрать в силу ГБ действие y 2 . Аналогично,
+
второй агент, делая ход первым, может выбрать действие (x - y1 ),
+
вынуждая первого агента выбрать действие y1 .
Закончив рассмотрение иллюстративного примера, обсудим в
каких случаях реализация права первого хода некоторым множест-
вом игроков S выгодна для всех игроков.
Очевидно, что, если все элементы множества EN эффективны
по Парето, то всегда найдется игрок, для которого изменение рав-
новесия невыгодно (см. приведенный выше пример с двумя игро-
ками). Так как "цена вопроса" для игроков из множества S опреде-
105
ляется разностью между их выигрышами при текущем равновесии
и максимумом выигрышей, которые они могут получить, изменяя
равновесие внутри множества EN за счет приоритета в моменте
выбора стратегии, то возможно использование побочных платежей

<<

стр. 3
(всего 4)

СОДЕРЖАНИЕ

>>