стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>

РОССИЙСКАЯ АКАДЕМИЯ НАУК
Институт проблем управления
им. В.А. Трапезникова




Д.А. Новиков




ИНСТИТУЦИОНАЛЬНОЕ УПРАВЛЕНИЕ
ОРГАНИЗАЦИОННЫМИ СИСТЕМАМИ




Москва – 2004
УДК 007
ББК 32.81
Н 73

Новиков Д.А. Институциональное управле-
ние организационными системами. М.: ИПУ
РАН, 2004. – 68 с.


Настоящая работа содержит результаты исследований теоре-
тико-игровых моделей институционального управления, понимае-
мого как целенаправленное воздействие на ограничения и нормы
деятельности участников организационных систем.
Работа рассчитана на специалистов (теоретиков и практиков)
по управлению организационными системами.




Рецензент: д.т.н., проф. А.В. Щепкин




Утверждено к печати Редакционным советом Института




© Институт проблем управления РАН, 2004
2
СОДЕРЖАНИЕ

1. Введение ............................................................................................4
2. Классификация управлений .............................................................4
3. Институциональная экономика .......................................................7
4. Управление ограничениями деятельности .....................................8
4.1. Модели принятия решений ...............................................9
4.2. Задача институционального управления .......................12
4.3. Институциональное и мотивационное управление.......16
4.4. Институциональное управление в многоэлементных
системах ...........................................................................................19
4.5. Модели ограниченной рациональности .........................28
5. Управление нормами деятельности ..............................................33
5.1. Постановка задачи управления нормами деятельности33
5.2. Решение задачи управления нормами деятельности ....36
5.3. Унифицированные нормы деятельности .......................38
5.4. Роль информированности агентов..................................40
5.5. Пример управления нормами деятельности: "Аккордная
оплата труда" ...................................................................................54
5.6. Пример управления нормами деятельности: "Дуополия
Курно" ..............................................................................................62
6. Заключение ......................................................................................64
Литература...........................................................................................65




3
1. ВВЕДЕНИЕ

Настоящая работа посвящена исследованию такого типа
управления организационными системами как институциональное
управление – целенаправленное воздействие на ограничения и
нормы деятельности участников организационных систем.
Изложение материала1 имеет следующую структуру. Во вто-
ром разделе вводится классификация управлений, которая, совме-
стно с кратким анализом проблематики институциональной эко-
номики (раздел 3) позволяет выделить в качестве объектов
управления ограничения деятельности и нормы деятельности,
управление которыми рассматривается, соответственно, в разделах
4 и 5.
Заключение содержит краткое обсуждение основных резуль-
татов и перспектив дальнейших исследований.


2. КЛАССИФИКАЦИЯ УПРАВЛЕНИЙ

В соответствии с определением, приведенным в [43, c. 195],
институт – «1) в социологии – определенная организация обще-
ственной деятельности и социальных отношений, воплощающая в
себе нормы экономической, политической, правовой, нравственной
и т.п. жизни общества, а также социальные правила жизнедеятель-
ности и поведения людей; 2) в праве – совокупность норм права,
регулирующих какие-либо однородные обособленные обществен-
ные отношения». Таким образом, ключевым является понятие
нормы – «узаконенного установления, признанного обязательным
порядка» [43, c. 338].
Различают явные (например, закон, контракт, должностная ин-
струкция и т.д.) и неявные нормы (например, этические нормы,
организационная или корпоративная культура и т.д.). Как правило,
явные нормы носят ограничивающий характер, а неявные – побу-
ждающий, то есть, последние отражают то поведение субъекта,
которого от него ожидают остальные.

1
В написании отдельных разделов принимали участие В.И. Зинченко и
К.А. Сухачев.
4
Для того чтобы определить место институционального управ-
ления среди других типов управления, перечислим параметры
модели организационной (активной) системы (ОС) [8, 29]:
- состав ОС (участники, входящие в ОС, то есть ее элементы);
- структура ОС (совокупность информационных, управляю-
щих, технологических и других связей между участниками ОС);
- множества допустимых действий участников ОС, отра-
жающие, в том числе, институциональные, технологические и
другие ограничения их совместной деятельности;
- целевые функции участников ОС, отражающие их предпоч-
тения и интересы;
- информированность – та информация, которой обладают
участники ОС на момент принятия решений о выбираемых страте-
гиях;
- порядок функционирования: последовательность получения
информации и выбора стратегий участниками ОС.
Управление ОС, понимаемое как воздействие на управляемую
систему с целью обеспечения требуемого ее поведения, может
затрагивать каждый из шести перечисленных ее параметров. Сле-
довательно, одним из оснований системы классификаций механиз-
мов управления ОС (процедур принятия управленческих решений)
является предмет управления – изменяемая в процессе и результате
управления компонента ОС.
По этому основанию можно выделить: управление составом
[15, 17, 27, 32], управление структурой [11, 30] (в которое обычно
в рамках теоретико-игровых моделей включают управление поряд-
ком функционирования [30]), институциональное управление
(управление «допустимыми множествами») [34], мотивационное
управление [32-34] (управление предпочтениями и интересами –
целевыми функциями) и информационное управление (управление
информацией, которой обладают участники ОС на момент приня-
тия решений) [36, 37] – см. рисунок 1.
В рамках введенной классификации институциональное
управление понимается в узком смысле – как ограничивающее, в
то время как побуждающий его аспект может быть отнесен к «сты-
ку» институционального (в узком смысле), мотивационного и
информационного управления (см. модели четвертого и пятого

5
разделов). Поэтому ниже мы будем рассматривать как управление
ограничениями деятельности (институтом ограничивающих норм),
так и управление институтом побуждающих норм.


Управление составом
Информационное
управление



Управление
УПРАВЛЕНИЕ ОС
структурой


Мотивационное
Институциональное
управление
управление

Рис. 1. Типы управлений ОС

Таким образом, предметом исследования в настоящей работе
является институциональное управление – целенаправленное
воздействие на ограничения и нормы деятельности участников
организационной системы.
В качестве отступления отметим, что теоретико-игровые мо-
дели управления нормами деятельности практически не рассмат-
ривались, а модели управления ограничениями деятельности каса-
лись:
- игр с запрещенными ситуациями [12];
- динамических моделей [31], в которых множество допусти-
мых действий агента зависело от параметра, выбираемого
центром;
- производственных цепочек [34], в которых существует тех-
нология, накладывающая ограничения на последовательный
выбор агентами своих действий;
- механизмов управления с сообщением информации [40], в
которых центр, изменяя множества допустимых сообщений
агентов, мог добиться неманипулируемости механизма (то
есть того, чтобы всем агентам было выгодно сообщать дос-
товерную информацию).
6
Кроме того, первоначально, роль институтов начала исследо-
ваться в таком разделе экономической науки, как институциональ-
ная экономика, основные результаты которой кратко обсуждаются
в следующем разделе.


3. ИНСТИТУЦИОНАЛЬНАЯ ЭКОНОМИКА

Институциональная экономика – раздел экономической тео-
рии, исследующий роль и влияние институтов [10, 38-44] и вклю-
чающий два научных направления: неоинституциональная эконо-
мика (включая теории общественного выбора и прав
собственности), связанная, в первую очередь, с именем Рональда
Коуза, и новая институциональная экономика (Дуглас Норт).
Совокупность институтов образует институциональную
структуру общества и экономики. Институты, – по мнению Дугла-
са Норта, – создают базовые структуры, с помощью которых люди
снижают степень своей неуверенности. Институты по Д. Норту –
«правила игры» в обществе, которые организуют отношения меж-
ду людьми. В составе институтов Д. Норт выделяет три главных
составляющих [38]:
- формальные правила (конституции, законы, административ-
ные акты, официально закрепленные нормы права);
- неформальные ограничения (традиции, обычаи договоры, со-
глашения, добровольно взятые на себя нормы поведения, не-
писаные кодексы чести, достоинства, профессионального
самосознания и пр.);
- механизмы принуждения, обеспечивающие соблюдение пра-
вил (суды, полиция и т.д.).
Несмотря на нерядоположенность перечисления, можно ви-
деть, что формальные правила отражают запрещающие нормы, а
неформальные ограничения – побуждающие нормы.
Роль институтов – уменьшение неопределенности путем уста-
новления устойчивой, хотя и не всегда эффективной, структуры
взаимодействия между людьми, определение и ограничение набора
альтернатив, которые имеются у каждого человека. Институцио-
нальные предпосылки оказывают решающее влияние на то, какие

7
именно организации возникают, и на то, как они развиваются. Но,
в свою очередь, и организации оказывают влияние на процесс
изменения институциональных рамок. Результирующее направле-
ние институциональных изменений формируется, во-первых,
«эффектом блокировки», возникающим вследствие сращивания
институтов и организаций на основе структуры побудительных
мотивов, создаваемой этими институтами, и, во-вторых, обратным
влиянием изменений в наборе возможностей на восприятие и
реакцию индивидов [19].
В работах Д. Норта и его последователей построена общая
концепция институтов и институциональной динамики, опираю-
щаяся на понятия прав собственности, трансакционных издержек,
контрактных отношений и групповых интересов. Благодаря освое-
нию экономической наукой этих понятий стало возможно изучение
институциональной структуры производства (институты влияют на
экономические процессы тем, что, в том числе, оказывают воздей-
ствие на издержки обмена и производства). Отдельным и чрезвы-
чайно важным вопросом, изучаемым институциональной экономи-
кой, является роль государства (государственного регулирования)
в экономике.
Таким образом, институты являются предметом исследований
в институциональной экономике, однако, отсутствие соответст-
вующих формальных моделей и конструктивных результатов
делают возможным использование данного раздела экономической
теории лишь в качестве методологической основы институцио-
нального управления ОС.


4. УПРАВЛЕНИЕ ОГРАНИЧЕНИЯМИ ДЕЯТЕЛЬНОСТИ

Настоящий раздел посвящен рассмотрению теоретико-
игровых моделей такой разновидности институционального управ-
ления как управление ограничениями деятельности. В подразделе
4.1 приводится используемый в теории управления подход к опре-
делению рационального поведения субъектов – описываются
модели принятия ими решений на основании целевых функций.
Затем формулируется задача управления ограничениями и обсуж-

8
даются методы ее решения (подраздел 4.2), исследуется взаимо-
связь между институциональным и мотивационным управлением
(подраздел 4.3) и приводятся результаты решения задач институ-
ционального управления в многоэлементных двухуровневых де-
терминированных организационных системах (подраздел 4.4).
Заключительный подраздел 4.5 содержит обобщение полученных
результатов на случай, когда поведение агентов описывается в
рамках моделей ограниченной рациональности.


4.1. МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ

Рассмотрим организационную систему (ОС), состоящую из
центра и агентов, обладающих свойством активности, то есть
собственными предпочтениями и способностью самостоятельно
предпринимать некоторые действия.
В соответствии с подходами теории иерархических игр [12] и
теории активных систем [16] центром будем называть игрока,
делающего ход первым (то есть метаигрока, обладающего правом
устанавливать правила игры для других игроков), а агентами –
игроков, делающих ход вторыми при известных им выборе первого
игрока. В моделях управления социально-экономическими систе-
мами центр играет роль управляющего органа, агент – роль управ-
ляемого субъекта, причем первоначально распределение «ролей»
может не быть фиксированным (см. модели сетевого взаимодейст-
вия в [30]).
Для решения задачи выбора оптимального управляющего воз-
действия (объектами этого воздействия могут быть перечисленные
во втором разделе параметры ОС) центр должен уметь предсказы-
вать поведение управляемых субъектов, следовательно, он должен
использовать ту или иную модель принятия решений агентами.
Опишем, следуя [16], модель принятия решений одним аген-
том (случай индивидуального принятия решений). Пусть агент
способен выбирать некоторое действие y из множества A допусти-
мых действий. В результате выбора действия y ? A агент получает
выигрыш f(y), где f: A > ?1 – действительнозначная целевая функ-
ция, отражающая предпочтения агента.

9
Примем гипотезу рационального поведения (ГРП) [16, 29], за-
ключающуюся в том, что агент с учетом всей имеющейся у него
информации выбирает действия, которые наиболее предпочти-
тельны с точки зрения значений своей целевой функции. В соот-
ветствии с гипотезой рационального поведения агент выбирает
альтернативу из множества «лучших» альтернатив. В рассматри-
ваемом случае это множество является множеством альтернатив,
на которых достигается максимум целевой функции.
Следовательно, выбор действия агентом определяется прави-
лом индивидуального рационального выбора P(f, A) ? A, которое
выделяет множество наиболее предпочтительных с точки зрения
агента действий1: С(f, A) = Arg max f(y).
y? A
Можно усложнить модель, предположив, что выигрыш агента
определяется не только его собственными действиями, но и значе-
нием неопределенного параметра ? ? ? – состояния природы. То
есть в результате выбора действия y ? A и реализации состояния
природы ? ? ? агент получает выигрыш f(?, y), где f: ? ? A > ?1.
Если выигрыш агента зависит, помимо его действий, от неоп-
ределенного параметра – состояния природы, то в общем случае не
существует однозначно «лучшего» действия – принимая решение о
выбираемом действии, агент должен «предсказывать» состояние
природы.
Поэтому введем гипотезу детерминизма, заключающуюся в
том, что агент стремится устранить с учетом всей имеющейся у
него информации существующую неопределенность и принимать
решения в условиях полной информированности [16, 33] (другими
словами, окончательный критерий, которым руководствуется
агент, принимающий решения, не должен содержать неопределен-
ных параметров).
В зависимости от той информации I, которой обладает агент о
неопределенных параметрах, различают [29, 33]: интервальную
неопределенность (когда известно только множество ? возможных
значений неопределенных параметров); вероятностную неопреде-
ленность (когда, помимо множества ? возможных значений неоп-
1
При использовании максимумов и минимумов подразумевается, что они дости-
гаются.
10
ределенных параметров, известно их вероятностное распределение
p(?)); нечеткую неопределенность (когда, помимо множества ?
возможных значений неопределенных параметров, известна функ-
ция принадлежности их значений).
Интервальная неопределенность устраняется вычислением
максимального гарантированного результата (МГР), вероятност-
ная – ожидаемого значения целевой функции, нечеткая – множест-
)
ва максимально недоминируемых альтернатив. Обозначим f ? f
I
– процедуру устранения неопределенности, то есть процесс пере-
)
хода от целевой функции f(?, y) к целевой функции f (y), которая
не зависит от неопределенных параметров. В соответствии с вве-
денным предположением в случае интервальной неопределенности
)
f (y) = min f(?, y), в случае вероятностной неопределенности
? ??
)
f (y) = ? f ( y ,? ) p (? )d? и т.д. [29, 33].
?
Устранив неопределенность, получаем детерминированную
модель, то есть правило индивидуального рационального выбора
имеет вид:
)
С(f, A, I) = Arg max f (y),
y? A
где I – информация, используемая агентом при устранении неопре-
)
деленности f ? f .
I
До сих пор мы рассматривали индивидуальное принятие ре-
шений. Возможна и игровая неопределенность, отражающая со-
вместное принятие решений несколькими агентами (при заданных
управлениях со стороны центра), в рамках которой существенными
являются предположения агента о множестве возможных значений
обстановки игры (действий других агентов, выбираемых ими в
рамках тех или иных неточно известных рассматриваемому агенту
принципов поведения). При игровой неопределенности в качестве
предсказуемого и устойчивого исхода игры агентов выбирается та
или иная концепция равновесия [16]. Более подробное рассмотре-
ние моделей принятия решений в условиях игровой неопределен-

11
ности приводится ниже при описании соответствующих задач
институционального управления.
Завершив краткое рассмотрение модели принятия решений и
подчеркнув, что выбор агента зависит от множества, из которого
этот выбор производится, перейдем к постановке задачи институ-
ционального управления как управления ограничениями деятель-
ности (модели управления нормами деятельности рассматриваются
в пятом разделе).


4.2. ЗАДАЧА ИНСТИТУЦИОНАЛЬНОГО УПРАВЛЕНИЯ

В соответствии с результатами предыдущего раздела выбор
агента из множества A, максимизирующий его целевую функцию
f(?), есть С(f, A) = Arg max f(y). Предположим, что задано некото-
y? A

рое универсальное множество X, и задачей центра (задачей инсти-
туционального управления – как управления ограничениями)
является выбор ограничения B ? X множества допустимых дейст-
вий агента с учетом того, что последний выберет действие из
множества С(f, B) = Arg max f(y).
y?B
Пусть предпочтения центра заданы функционалом
?(y, B): X ? 2 > ? , позволяющим сравнивать пары «действие
X 1

агента – множество его допустимых действий».
Зависимость предпочтений центра от множества B допусти-
мых действий агента обусловлена тем, что введение тех или иных
ограничений может потребовать от центра определенных затрат.
Если функционал центра ?(y) не зависит от допустимого множест-
ва B, то задача институционального управления вырождается:
центру достаточно выбрать B = {x}, где x = arg max ?(y).
y? X

В соответствии с общим подходом теории управления к по-
становке задачи управления [16, 29, 32], назовем эффективностью
институционального управления B ? X следующую величину:
(1) K(B) = max ?(y, B).
y?C ( f , B )



12
При определении эффективности (1) предполагается, что агент
благожелательно настроен к центру и из множества максимумов
своей целевой функции выбирает действие, которое наиболее
благоприятно с точки зрения центра.
Задача институционального управления заключается в выборе
оптимального институционального управления B* ? X, то есть
допустимого управления, имеющего максимальную эффектив-
ность:
(2) K(B) > max ,
B?2
X


то есть
max ?(y, B).
(3) B* = arg max
B?2
X y?C ( f , B )
Перебор всех элементов булеана 2X множества X может ока-
заться чрезвычайно трудоемкой задачей даже в случае конечного
множества X. В случае же бесконечного множества X эта задача
может оказаться неразрешимой. Поэтому рассмотрим ряд случаев,
в которых удается использовать специфику целевых функций
и/или допустимых множеств для того, чтобы свести задачу (2) к
той или иной известной задаче.
Предположим, что целевая функция агента непрерывна и дей-
ствительнозначна, а множество X – компакт в ? m. Определим
следующие величины и множества:
(4) f - = min f(y),
y? X

(5) f + = max f(y),
y? X

(6) l(w) = {y ? X | f(y) ? w}, w ? [f -; f +],
(7) h(w) = {y ? X | f(y) = w}, w ? [f -; f +],
(8) L(x) = {y ? X | f(y) ? f(x)}, x ? X,
(9) x(B) = arg max ?(y, B), B ? X,
y?C ( f , B )

?(y, B), x ? X.
max
(10) B(x) = arg
B?{ D ?2 X | x?C ( f , D )}

В рамках введенных определений имеет место
(11) x ? C(f, L(x)), x ? X,
(12) h(w) = C(f, l(w)), w ? [f -; f +],

13
поэтому задачу (2)-(3) можно записать в виде
(13) B* = B(y*),
где
(14) y* = arg max ?(y, B(y)),
y? X

или в виде
(15) B* = arg max ?(x(B), B).
B?2
X


Видно, что задачи нахождения максимумов (14) и (15) в об-
щем случае не проще чем исходная задача (3). Поэтому рассмот-
рим случай, когда задана параметрическая (с параметрами
?? [0; 1] и x0 ? X) система множеств M?, такая, что M0 = x0, M1 = X
и ? 0 ? ? ? ? ? 1, M? ? M?.
Величина ? может интерпретироваться как «степень центра-
лизации управления» [29] – значение ? = 0 соответствует полной
централизации («все, кроме x0, запрещено»), значение ? = 1 соот-
ветствует полной децентрализации («все разрешено»).
Определим функционал ??(y) = ?(y, M?), y ? X, ? ? [0; 1]. То-
гда при фиксированном x0 ? X в качестве институционального
управления можно рассматривать параметр ?, а его эффективно-
стью считать величину (ср. с (1)):
(16) K(?) = max ??(y).
y?C ( f , M ? )
В рамках рассматриваемой модели задача институционального
управления примет вид
(17) K(?) > max ,
? ?[ 0;1]
а оптимальным будет значение
(18) ?* = arg max max ??(y).
? ?[ 0;1] y?C ( f , M ? )
По аналогии с (4)-(14) задача (17) может быть преобразована
следующим образом. Обозначим
(19) x(?) = arg max ??(y), ?? [0; 1],
y?C ( f , M ? )

(20) ?(x) = arg ??(y), x ? X.
max
? ?{ ? ?[ 0;1]| x?C ( f , M ? )}

(21) y* = arg max ??(y)(y),
y? X


14
(22) ?* = arg max ??(x(?)).
? ?[ 0;1]
Задачи (21) и (22) являются стандартными оптимизационными
задачами, поэтому основная сложность заключатся в вычислении
зависимостей (19) и (20). Для этого необходимо определять мно-
жества, по которым берутся максимумы – множество выбора
агента при заданном институциональном управлении в (19) и
множество таких институциональных управлений, при которых
данное действие доставляет максимум целевой функции агента
(см. (20)).
Предположим, что функция f(?) на допустимом множестве X
имеет конечное число n локальных максимумов. Обозначим x1, x2,
…, xn – точки максимума (как минимум, один из них – глобаль-
ный), которые занумерованы так, что ?1 ? ?2 ? … ? ?n, где
?i = min {? ? [0; 1] | xi ? M?}, i = 1, n . Тогда x(?) – непрерывная
справа функция с точками разрыва {?i}i = 1, n .
Обозначим ?' = min {? ? [0; 1] | max f(y) = max f(y)}.
y? X y?M ?

В качестве примера рассмотрим случай, когда X ? ?1, а f(?) –
вогнутая функция. Тогда существует единственный максимум x1 и
x(?) – непрерывная функция при ? ? [0; ?'], а (22) является стан-
дартной оптимизационной задачей.
Пусть X = [0; 1], ?(y) = y – ? y2, где ? > 0 – константа,
? ? , ? ? [0;? ' ]
M? = [0; ?], f(y) = y – y2. Тогда ?' = 1/2, и x(?) = ? ,
1 / 2, ? ? [0;? ' ]
?
а ??(x(?)) = x(?) – ? ?2 = ? – ? ?2 при ? ? [0; 1/2] и ??(x(?)) = 1/2 –
? / 4 при ? ? [1/2; 1]. Решением задачи институционального
? 1 / 2? , ? ? 1
управления является ?* = ? .
1 / 2, ? ? [0;1]
?




15
4.3. ИНСТИТУЦИОНАЛЬНОЕ И МОТИВАЦИОННОЕ
УПРАВЛЕНИЕ

Введем в целевую функцию центра в явном виде затраты Q(B),
Q: 2 > ? 1, на управление ограничениями B:
X

(1) ?(y, B) = H(y) – Q(B),
где H(y), H: X > ? 1, – функция дохода центра.
Определим множества
(2) D(x) = {y ? X | f(y) > f(x)}, x ? X.
Очевидно, что y ? C(f(?), B) тогда и только тогда, когда
D(y) ? B = ?, поэтому управление ограничениями можно рассмат-
ривать не только как выбор множества допустимых действий
агента, но и как запрет выбора определенных его действий. Опре-
делим "стоимость запрета":
Q(B), x ? X.
min
(3) q(x) =
{ B ? X |B ? D ( x ) = ?}
Величина q(x), определяемая выражением (3), может рассмат-
риваться как минимальные затраты центра на институциональ-
ное управление по реализации (побуждения агента к выбору) дей-
ствия x ? X.
При известных минимальных затратах центра на институцио-
нальное управление задача институционального управления сво-
дится к задаче оптимального согласованного планирования –
определить оптимальное реализуемое действие агента, то есть
(4) xI* = arg max [H(y) – q(y)].
y? X
Эффективность институционального управления при этом
равна
(5) KI = H(xI*) – q(xI*).
Рассмотрим теперь мотивационное управление, которое за-
ключается в побуждении центром агента к выбору определенных
действий за счет введения системы доплат, зависящих от этого
выбора. Другими словами, центр поощряет агента в случае выбора
требуемых действий (планов). Известно [29, 32], что минимальные
затраты центра на мотивационное управление по реализации (по-
буждения агента к выбору) действия x ? X равны
(6) c(x) = max f(y) – f(x), x ? X.
y? X
16
Используя систему стимулирования
?c ( x ) + ? , y = x
?(x, y) = ? ,
y?x
? 0,
где ? > 0 – сколь угодно малая строго положительная константа,
центр побуждает агента выбрать действие x ? X как единственную
точку максимума его целевой функции f(y) + ?(x, y).
При известных минимальных затратах центра на мотивацион-
ное управление задача мотивационного управления сводится к
задаче оптимального согласованного планирования – определить
оптимальное реализуемое действие агента, то есть
(7) xm* = arg max [H(y) – c(y)].
y? X
Эффективность мотивационного управления при этом равна
(8) Km = H(xm*) – q(xm*).
Сравнение минимальных затрат центра на управление (3) и (6)
позволяет делать выводы о сравнительной эффективности инсти-
туционального и мотивационного управления. Таким образом, мы
обосновали справедливость следующего утверждения.
Утверждение 1. Для того чтобы KI ? Km, то есть, эффектив-
ность институционального управления была не ниже эффективно-
сти мотивационного управления, достаточно, чтобы имело место
(9) ? x ? X q(x) ? c(x).
Отметим, что условие (9) является достаточно грубым и, есте-
ственно, не является необходимым условием.
На практике, институциональное и мотивационное управления
используются совместно, то есть, выбор некоторых действий
запрещается центром, а за некоторые из разрешенных действий он
устанавливает дополнительные вознаграждения. Поэтому рассмот-
рим формальную модель, позволяющую определить рациональный
баланс между институциональным и мотивационным управлением.
Так как в рамках мотивационного управления агент произво-
дит выбор действия, максимизирующего его целевую функцию (с
учетом установленного центром стимулирования) на множестве
допустимых действий, а "допустимые" действия агента определя-
ются институциональным управлением со стороны центра, то
определим по аналогии с (6) минимальные затраты центра на

17
мотивационное управление по реализации (побуждения агента к
выбору) действия x ? B:
(10) c(x, B) = max f(y) – f(x), x ? B.
y?B

Тогда целевую функцию центра (1) можно записать в виде
(11) ?(y, B) = H(y) – c(y, B) – Q(B), y ? B, B ? X.
Первое слагаемое – доход центра, второе слагаемое – затраты
по обеспечению выбора агентом из множества B именно действия
y, третье слагаемое – затраты на институциональное управление.
Вычислим минимальные затраты центра на совместное инсти-
туциональное и мотивационное управление по реализации (побуж-
дения агента к выбору) действия x ? X
(12) G(y) = min {c(y, B) + Q(B)}, y ? X.
{ B ? X | y?B }

Если известна зависимость (12), то задача совместного моти-
вационного и институционального управления заключается в
решении задачи оптимального согласованного планирования:
(13) x* = arg max [H(y) – g(y)].
y? X

В качестве иллюстрации вернемся к примеру, рассмотренному
в конце предыдущего подраздела. Пусть X = [0; 1], H(y) = y,
M? = [0; ?], Q(?) = ? ?2, где ? > 0 – константа, f(y) = y – y2. Тогда
c(u, ?) = f(min{?; 1/2}) – f(y), G(y) = min {f(min{?; 1/2}) – f(y) –
? ?[ 0; y ]

Q(?)}, то есть
x* = max [y – min {min{?; 1/2} – (min{?; 1/2})2 – y + y2 + ? ?2}].
? ?[ 0; y ]
y?[ 0;1]
Таким образом, результаты настоящего подраздела позволяют
сравнивать эффективности институционального и мотивационного
управления, а также определять рациональный баланс между
запретами и мотивацией агента. Следует отметить, что высокая
сложность задач институционального управления приводит к тому,
что на практике они решаются либо для частных случаев (ситуа-
ций, когда множества допустимых действий или варианты накла-




18
дываемых ограничений конечны1), либо путем сравнения конечно-
го числа вариантов управлений определяется не оптимальный, а
рациональный вариант, эффективность которого устраивает центр.


4.4. ИНСТИТУЦИОНАЛЬНОЕ УПРАВЛЕНИЕ В
МНОГОЭЛЕМЕНТНЫХ СИСТЕМАХ

Рассмотрим, следуя [34], ОС, состоящую из одного центра и n
агентов с целевыми функциями fi(y), i ? N = {1, 2, …, n},
y = (y1, y2, …, yn). Предположим, что, помимо индивидуальных
ограничений на множества допустимых стратегий: yi ? Ai, i ? N,
существуют глобальные ограничения B на выбор состояний аген-
n
? Ai .
тами, то есть y ? A’ ? B, где A’ =
i =1
Можно выделить несколько методов учета глобальных огра-
ничений, то есть методов сведения теоретико-игровых моделей с
глобальными ограничениями на множества допустимых стратегий
игроков к моделям, для которых имеет место гипотеза независи-
мого поведения (ГНП), в соответствии с которой допустимым
является любой вектор действий агентов, все компоненты которого
принадлежат соответствующим допустимым множествам (другими
n
словами, отсутствуют ограничения, кроме y ? A’ = ? Ai ).
i =1
Метод штрафов. Данный метод заключается в том, что в слу-
чае, когда вектор действий агентов оказывается вне множества B
(то есть y ? B), целевые функции игроков считаются равными
минус бесконечности – игроки штрафуются за нарушение ограни-
чений. Далее можно рассматривать игру с «новыми» целевыми
функциями, в которой отсутствуют глобальные ограничения. В
зависимости от информированности игроков и того, кто из игроков


1
Задачу управления ограничениями можно формулировать и следующим обра-
зом: существует конечное число возможных ограничений, требуется найти
оптимальную комбинацию этих ограничений. Данная задача дискретной оптими-
зации может быть решена методом динамического программирования.
19
нарушает глобальные ограничения, строятся гарантирующие стра-
тегии [12].
Метод расширения стратегий. В исходной игре все агенты
выбирают свои стратегии одновременно и независимо, не обмени-
ваясь информацией с другими игроками (возможность и целесооб-
разность обмена информацией – информационные расширения игр
– в играх с запрещенными ситуациями описаны в [12]). Можно
рассмотреть игру, в которой каждый из игроков делает предполо-
жения о выборе других игроков или реакции других игроков на
выбор им той или иной стратегии. В подобных играх используют
концепцию П-решения (см. также Байесовское равновесие, равно-
весие Штакельберга и др. [16, 37, 50]), которая включает в себя
максиминные равновесия, равновесия Нэша и ряд других как
частные случаи.
Существует несколько частных случаев, в которых учет гло-
бальных ограничений производится «автоматически». Если у
каждого из игроков имеется доминантная стратегия (или в игре
существует единственное равновесие Нэша), и игра характеризует-
ся полной информированностью, то каждый из игроков может
вычислить доминантные стратегии всех остальных игроков (соот-
ветственно – точку Нэша). Если при этом вектор доминантных
стратегий (или точка Нэша) удовлетворяют глобальным ограниче-
ниям, то проблем их учета не возникает.
Отметим, что метод расширения стратегий зачастую требует
от исследователя операций введения трудно обосновываемых
предположений о принципах поведения игроков.
Если в методе штрафов и в методе расширения стратегий ни-
как не оговаривалось наличие управления со стороны центра, то
следующие два метода учета глобальных ограничений существен-
но используют управляющие возможности центра.
Метод согласования. Основная идея метода согласования за-
ключается в следующем (см. также двухшаговый метод решения
вероятностных и др. задач стимулирования и метод согласованно-
го планирования [29, 32, 33]). На первом шаге решения задачи
управления (стимулирования) центр для каждого вектора дейст-
вий, принадлежащего множеству A’ (без учета глобальных ограни-
чений) ищет допустимое управление, при котором данный вектор

20
действий принадлежит множеству решений игры агентов. Резуль-
татом первого шага, например, в задаче стимулирования, является
множество AM действий агентов, реализуемых при данных ограни-
чениях M на систему стимулирования, AM ? A’. Затем на втором
шаге центр ищет множество A* действий агентов, которые, во-
первых, реализуемы, во-вторых, удовлетворяют заданным гло-
бальным ограничениям B, и на которых достигается максимум его
целевой функции – см. предыдущий раздел. То есть, на втором
шаге центр решает следующую задачу:
(1) A* = Arg max ?(y).
y ? AM ? B

Максимальная эффективность управления при этом равна
?(y ), где y* – произвольный элемент множества A*.
*

Метод изменения порядка функционирования. Обычно
предполагается, что при известной стратегии центра агенты выби-
рают свои действия одновременно и независимо. Если центр (как
метаигрок) может изменить порядок функционирования, то есть
последовательность получения информации и выбора стратегий
агентами, то, варьируя последовательность выбора стратегий
агентами, можно существенно упростить задачу учета глобальных
ограничений. Если существует нумерация агентов, такая что до-
пустимые множества имеют вид: Ai = Ai(y1, y2, …, yi-1), то каждый
агент должен при выборе своей стратегии учитывать ограничения,
наложенные совместно глобальным ограничением и уже выбран-
ными стратегиями агентов с меньшими номерами.
Например, допустимой с рассматриваемой точки зрения явля-
ется последовательность функционирования ОС, имеющая вид
сетевого графика (без контуров). Частным случаем является после-
довательный выбор стратегий агентами – так называемые произ-
водственные цепочки [34].
Еще раз подчеркнем, что возможность использования метода
изменения порядка функционирования должна быть предусмотре-
на «правилами игры», то есть, учтена в модели ОС. Кроме того,
следует иметь в виду, что множество равновесий в новой «иерар-
хической» игре может отличаться то множества равновесий в
исходной игре [30, 35].


21
Закончив перечисление методов учета глобальных ограниче-
ний, перейдем к систематическому описанию различных вариантов
взаимозависимости и взаимосвязи агентов в многоэлементных ОС.
Взаимозависимость и взаимосвязь агентов. В [34] ОС с за-
висимыми агентами были названы системы, в которых либо суще-
ствуют глобальные ограничения на множество возможных дейст-
вий, либо/и целевая функция каждого агента зависит не только от
его собственных действий, но и от действий других агентов. Для
того чтобы различать эти два случая, мы будем придерживаться
следующей терминологии: если агенты производят свой выбор
независимо (отсутствуют глобальные ограничения на вектор дей-
ствий агентов), и целевая функция каждого агента зависит только
от его собственной стратегии, и отсутствуют общие ограничения
на управляющие переменные (допустимые функции стимулирова-
ния и т.д.), то такую ОС будем называть ОС с независимыми и
несвязанными агентами1. Если добавляются общие ограничения на
управления, то такие ОС будем называть ОС со слабо связанными
агентами (агенты оказываются связаны косвенно – через ограни-
чения на стратегии центра) [29, 33, 34]. Если добавляется зависи-
мость целевой функции агентов от обстановки игры, то такую ОС
будем называть ОС с сильно связанными (но независимыми!) аген-
тами. Если добавляются только общие ограничения на множество
стратегий агентов системы, то такую ОС будем называть ОС с
зависимыми агентами (см. таблицу 1 ниже).
В [32, 34] исследовались задачи стимулирования в ОС с силь-
но связанными и независимыми агентами. В рамках гипотезы
независимого поведения оптимальным оказывалось использование
центром принципа декомпозиции игры агентов. Этот принцип
заключается в следующем. Центр обещает каждому агенту: «я
компенсирую твои затраты (подставив в них сложившуюся ситуа-
цию игры) только в том случае, если твое действие совпадет с
планом, во всех остальных случаях твое вознаграждение будет
равным нулю». Использование такого управления реализует век-
тор планов как равновесие в доминантных стратегиях игры аген-

1
Таким образом, «независимость» агентов отражает свойства множеств их
допустимых стратегий, а «связанность» – зависимость целевой функции агента
от действий других агентов или наличие общих ограничений на управление.
22
тов. Рассмотрим теперь, как изменится этот результат в случае,
когда агенты зависимы, то есть, когда существуют глобальные
ограничения на совместный выбор агентами своих действий.
Метод штрафов в задачах стимулирования в многоэлемент-
ных ОС имеет следующий вид. В общем случае считаем, что затра-
ты агентов несепарабельны и приравниваем их минус бесконечно-
сти при недопустимых (с точки зрения глобальных ограничений)
действиях агентов, после чего применяем технику анализа, опи-
санную в [34] для ОС с независимыми агентами.
Метод согласования может использоваться в приведенном
выше виде без каких-либо изменений. Напомним, что при решении
задач стимулирования в многоэлементных ОС реализуемый опти-
мальной квазикомпенсаторной системой стимулирования вектор
действий агентов входит в эту систему стимулирования как пара-
метр [34]. Поэтому, в более общем случае, охватывающем и метод
штрафов, и метод согласования, можно считать, что на агентов
(или центр, что то же самое в силу оптимальности компенсаторных
систем стимулирования) наложены штрафы следующего вида:
˜
? ? ( y ), y ? A'? B ˜
, где ? i ( y ) – некоторые неотрицательные
?i(y) = ? i
y ? A'? B
?0,
функции, i ? N. Тогда, если AM – множество реализуемых дейст-
вий, определяемых без учета глобальных ограничений на действия
агентов, то целевая функция центра в задаче стимулирования (с
учетом глобальных ограничений) имеет вид:
n
(2) ?(y) = H(y) – ? {ci ( y ) + ? i ( y )} .
i =1

Задача планирования запишется в виде:
n
? {ci ( y ) + ? i ( y )} ],
(3) x* = arg max [H(y) –
x? AM i =1
а максимальная эффективность1 стимулирования (эффективность
оптимальной системы стимулирования) равна K* = ?(x*).

1
Мы не будем останавливаться подробно на таких простых утверждениях,
следующих из анализа выражений (1)-(3), как то, что с расширением множеств
AM (то есть с ростом возможностей центра по управлению) и B (ослаблением
внешних – глобальных – ограничений) эффективность стимулирования не умень-
шается и т.д.
23
В таблице 1 представлены возможные комбинации глобаль-
ных ограничений («+» – наличие глобальных ограничений, «-» –
отсутствие глобальных ограничений) на множества допустимых
стратегий агентов, их целевые функции и управления.

Таблица 1
Классификация взаимосвязанности и взаимозависимости агентов
Множества Управления
Целевые
допустимых (допустимые
Тип ОС
функции
стратегий стратегии
агентов
агентов центра)
ОС с независимыми и
- - - несвязанными агентами
1.
ОС с зависимыми и
+ - - несвязанными агентами
2.
ОС с зависимыми и
сильно связанными
+ + -
3.
агентами
ОС с зависимыми и слабо
+ - + связанными агентами
4.
ОС с независимыми и
сильно связанными
- + -
5.
агентами
ОС с независимыми и
слабо связанными агента-
- - +
6.
ми
ОС с независимыми и
сильно связанными
- + +
7.
агентами
ОС с зависимыми и
сильно связанными
+ + +
8.
агентами

Рассмотрим, следуя [34], кратко все восемь случаев (см. таб-
лицу 1) и покажем для них, что при решении задач стимулирова-
ния в многоэлементных ОС с зависимыми агентами учет глобаль-
ных ограничений на множества допустимых действий агентов
возможно осуществлять, применяя как метод штрафов, так и метод
согласования, причем их использование не изменяет результатов
[32, 34] анализа систем с независимыми агентами.

24
Качественное обоснование справедливости последнего утвер-
ждения таково – взаимосвязь агентов (в смысле целевых функций)
учитывается при решении задач стимулирования, а, используя
выражения (2) и (3), удается декомпозировать и учесть «независи-
мо» факторы, связанные с ограничениями на множества допусти-
мых стратегий агентов и центра. Другими словами, в общем случае
алгоритм действий при учете глобальных ограничений таков: для
любой задачи стимулирования на втором этапе решения (этапе
поиска оптимального для центра реализуемого действия) максими-
зация целевой функции центра ведется не по всему множеству A’
допустимых действий агентов, а по множеству: A’ ? B ? AM.
При этом «автоматически» обеспечивается учет глобальных
ограничений как на действия агентов, так и на стимулирование.
Случай 1. ОС с независимыми и несвязанными агентами. Оче-
видно, что многоэлементная ОС с независимыми и несвязанными
агентами может быть представлена в виде набора невзаимодейст-
вующих одноэлементных ОС (ни согласование с глобальными
ограничениями, ни штрафы в данном случае не требуются). На
втором этапе решения задачи стимулирования максимизация
целевой функции центра ведется по множествам Ai, i ? N, незави-
симо.
Случай 2. ОС с зависимыми и несвязанными агентами. Отме-
тим, что в работе [12] при описании игр с запрещенными ситуа-
циями взаимозависимость агентов отражалась следующим обра-
зом: целевая функция i-го агента определялась как
?wi ( y ), y ? Bi
, где Bi ? A’, i ? N.
fi(y) = ?
? ?, y ? Bi
?
Если ? i ? N Bi = B, то имеет место случай одинаковых огра-
ничений. В дальнейшем мы по умолчанию ограничимся случаем
одинаковых ограничений, в котором центр имеет возможность
использовать индивидуальное стимулирование для каждого агента,
рассматривая в качестве реализуемых только вектора действий,
принадлежащие множеству допустимых с точки зрения глобаль-
ных ограничений (метод согласования), то есть на втором этапе
решения задачи стимулирования максимизация целевой функции
центра ведется по множеству A’ ? B.
25
Случай 3. ОС с зависимыми и сильно связанными агентами
(глобальные ограничения на управление отсутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра также ведется по множеству A’ ? B.
Случай 4. ОС с зависимыми и слабо связанными агентами
(глобальные ограничения на управление присутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра ведется по множеству A’ ? B ? AM.
Случай 5. ОС с независимыми и сильно связанными агентами
(глобальные ограничения на управление отсутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра ведется по множеству A’.
Случай 6. ОС с независимыми и слабо связанными агентами
(глобальные ограничения на управление присутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра ведется по множеству A’ ? AM. Как отмечалось
выше, задача управления ОС с независимыми и слабо связанными
агентами может быть сведена к параметрической задаче управле-
ния набором одноэлементных ОС и задаче выбора оптимального
значения параметра.
Случай 7. ОС с независимыми и сильно связанными агентами
(глобальные ограничения на управление присутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра также ведется по множеству A’ ? AM.
Случай 8. ОС с зависимыми и сильно связанными агентами
(глобальные ограничения на управление присутствуют). На втором
этапе решения задачи стимулирования максимизация целевой
функции центра ведется по множеству A’ ? AM ? B.
Таким образом, учет глобальных ограничений на стратегии
участников ОС (агентов и центра) производится методами штра-
фов или согласования в рамках метода декомпозиции игры агентов
в многоэлементных ОС.
Исследуем задачу управления ОС, в которой центр, помимо
выбора системы стимулирования, имеет возможность влиять и на
множества допустимых действий агентов (задачи управления ОС с
переменными множествами допустимых действий рассматрива-
лись как в теории активных систем [8], так и в теории иерархиче-
26
ских игр [12], причем, в основном, для динамических моделей –
см. обзор в [31]).
Рассмотрим, следуя [34], многоэлементную ОС, в которой
центр имеет возможность выбирать, помимо функций стимулиро-
вания, управляющие параметры ui ? Ui, i ? N, определяющие
множества допустимых действий агентов, то есть Ai = Ai(ui). Тогда
вектор действий агентов y принадлежит допустимому множеству
n n
? Ai (ui ) , u = (u1, u2, …, un) ? U’ = ? U i .
A(u) =
i =1 i =1
Предположим, что ? y ? A’ ? u ? U’: y ? A(u). Содержательно
данное предположение означает, что множество допустимых
управлений центра достаточно «велико» для того, чтобы сделать
допустимым любой вектор действий агентов.
Назначая определенные значения управляющих параметров
u ? U’, центр несет издержки ?(u), ?: U’ > ?1. Тогда целевая
функция центра имеет вид (в общем случае будем считать, что
затраты агентов несепарабельны, а индивидуальное стимулирова-
ние каждого агента зависит от действий всех агентов):
n
?? i ( y )
(4) ?(y, ?, u) = H(y) – – ?(u).
i =1
Действия y , выбираемые агентами, являются равновесием
*

Нэша при данных управлениях, то есть
n
? Ai (ui )
y ? EN(?, u) = {y ? | ? i ? N, ? zi ? Ai(ui)
*

i =1
?i(y) – ci(y) ? ?i(y-i, zi) – ci(y-i, zi)}.
Задача управления в рамках гипотезы благожелательности за-
ключается выборе управляющих параметров, максимизирующих
целевую функцию центра на множестве решений игры:
(5) max ?(y, ?, u) > max .
? ? M , u ?U ?
y?E N (? , u )
Для решения задачи (5) воспользуемся комбинацией принципа
декомпозиции игры агентов и выражений (1)-(3), позволяющих
учитывать глобальные ограничения.
Фиксируем произвольный вектор действий агентов x ? A’. Для
того чтобы этот вектор действий был реализуем, необходимо и
достаточно, чтобы он был равновесием Нэша (для этого достаточ-
27
но использовать соответствующую компенсаторную систему
стимулирования), и был допустимым действием (с точки зрения
ограничений на множества действий агентов). Для удовлетворения
последнему условию центр должен выбрать такие значения управ-
ляющего параметра u ? U’, чтобы ? i ? N xi ? Ai(ui).
Обозначим Ui(xi) = {ui ? Ui | xi ? Ai(ui)}, i ? N – множество та-
ких управлений, при которых действие xi является допустимым для
n
? U i ( xi ) . Минимальные затраты центра
i-го агента, i ? N; U(x) =
i =1
на обеспечение допустимости вектора действий x ? A’ равны:
˜
(6) ? (x) = min ?(u).
u?U ( x )

Из принципа компенсации затрат [32] и принципа декомпози-
ции игры агентов [34] следует, что в рассматриваемой модели
суммарные затраты центра по реализации действия x ? A’ равны
n
? ci ( x ) ˜
+ ? (x).
?(x) =
i =1
Оптимальным для центра действием агентов является дейст-
вие y*, максимизирующее разность между доходом центра и его
затратами на стимулирование:
(7) y* = arg max {H(x) – ?(x)}.
x? A?
Итак, выражение (7) дает оптимальное решение задачи управ-
ления в многоэлементной ОС в условиях, когда центр имеет воз-
можность управлять множествами допустимых действий агентов.


4.5. МОДЕЛИ ОГРАНИЧЕННОЙ РАЦИОНАЛЬНОСТИ

Рациональное поведение экономических агентов традиционно
моделируется их стремлением к увеличению значения некоторой
функции (функции полезности, выигрыша, целевой функции и т.д.),
определенной на множестве альтернатив, которые может выбирать
агент, и обстановок (внешних условий его деятельности) – см.
раздел 4.1 и [1, 4, 16, 24].


28
Рассмотрим одного агента (в одноэлементных моделях индекс,
обозначающий номер агента, будет опускаться), интересы которого
отражены его целевой функцией f(y), определенной на множестве
возможных действий A: y ? A, f: A > ?1. Тогда множеством рацио-
нального выбора будет множество действий, доставляющих макси-
мум целевой функции (см. также раздел 4.1):
(1) C0(f(?), A) = Arg max f(y).
y?A
Например, в экономико-математических моделях в качестве
функции полезности (целевой функции фирмы) во многих случаях
выступает прибыль фирмы.
Принцип (1) принятия решений соответствует так называемой
классической рациональности. В работах Г. Саймона было пред-
ложено рассматривать так называемые модели ограниченной ра-
циональности (ОР), то есть отказаться от предположения о стрем-
лении агента к достижению абсолютного максимума, заменив его
предположением о стремлении к достижению определенного
уровня полезности, быть может, зависящего от величины оптиму-
ма [41, 51].
В настоящем разделе описывается ряд моделей ограниченной
рациональности и обсуждается влияние предположений о рацио-
нальном поведении агентов на решения задач институционального
управления ОС.
Введем следующее предположение о целевой функции и до-
пустимом множестве: пусть f(?) непрерывна и вогнута, а множество
A выпукло и компактно. Очевидно, что в рамках этих предположе-
ний множество C0(f(?), A) непусто.
Обозначим y* = arg max f(y). Для простоты будем считать, что
y?A
f(y*) ? 0.
Следуя [30], введем в рассмотрения три типа ограниченной
рациональности.
Первый тип ОР. Предположим, что агент стремится к обеспе-
чению некоторого минимального уровня индивидуальной полезно-
сти U , то есть множеством рационального выбора можно считать
(2) C1(f(?), A, U ) = {y ? A | f(y) ? U }.


29
Второй тип ОР. Предположим, что агент готов смириться с
потерями фиксированной величины ? ? 0 по сравнению с абсолют-
ным максимумом, то есть множеством рационального выбора
можно считать
(3) C2(f(?), A, ?) = {y ? A | f(y) ? f(y*) – ?}.
Отметим, что этот способ учета «нечувствительности» и поро-
гов различения агентов наиболее распространен в теоретико-
игровых моделях, и при использовании в построении обобщенных
решений позволяет регуляризовывать критерии оптимальности и
добиться устойчивости решения по параметрам модели [9, 12, 23,
28]. Кроме того, данный тип представления рационального пове-
дения согласован с моделями ОС, учитывающими неопределен-
ность [33], в том числе – неопределенность целей агента.
Третий тип ОР. Предположим, что агент готов смириться с по-
терями, составляющими не более чем фиксированную часть
? ? (0; 1] от максимального выигрыша, то есть множеством рацио-
нального выбора можно считать
(4) C3(f(?), A, ?) = {y ? A | f(y) ? (1 – ?) f(y*)}.
Неравенство в (4) можно записать в эквивалентном виде:
f(y*) – f(y) ? ? f(y*).
Введенные три типа ограниченной рациональности охватыва-
ют большинство встречающихся на практике задач управления ОС.
Исследуем свойства множеств (2)-(4).
В рамках введенных предположений ? U ? 0, ? ? 0, ? ? (0; 1]
имеет место [30]:
- C0 ? C1, C0 ? C2, C0 ? C3;
- ? U ' ? U , ?’ ? ?, ?’ ? ? выполнено
C1(f(?), A, U ) ? C1(f(?), A, U ' ),
C2(f(?), A, ?) ? C2(f(?), A, ?’),
C3(f(?), A, ?) ? C3(f(?), A, ?’);
- C1(f(?), A, 0) = C2(f(?), A, 0) = C3(f(?), A, 0) = C0(f(?), A);
- для любого допустимого значения любого параметра (U ? 0,
? ? 0, ? ? (0; 1]) существуют значения двух других параметров, при
которых множества (2)-(4) совпадают.
Последнее свойство позволяет говорить об эквивалентности в
определенном смысле трех типов ОР, однако, использование в
30
моделях определенного типа ОР должно быть обусловлено специ-
фикой конкретной модели (например, для первого типа, в отличие
от второго и третьего, не требуется знания абсолютного максиму-
ма и т.д.).
Отметим, что существует целое семейство целевых функций,
имеющих одно и то же множество максимумов (1). Так, из теории
полезности известно [44, 46], что целевая функция определена с
точностью до положительного линейного преобразования, то есть
для любого числа a и любого положительного числа b функции f(?)
и g(y) = a + b f(y) имеют одинаковые множества максимумов:
C0(f(?), A) = C0(g(?), A).
В то же время, не все типы ограниченной рациональности об-
ладают свойством инвариантности множества выбора относитель-
но положительных линейных преобразований. Так, для первого
типа ОР множество (2), определенное для функции f(?), не изме-
нится, если в определении этого множества для функции
g(y) = a + b f(y) изменить U на a + b U . Для второго типа ОР
достаточно изменить ? на b ?. Для третьего типа ОР найти подоб-
ной замены общего вида не удается.
Рассмотрим, как изменится определение равновесия Нэша,
сформулированное первоначально для классической рационально-
сти, в рамках того или иного типа ограниченной рациональности.
Напомним, что равновесие Нэша в предположении классиче-
ской рациональности определяется следующим образом (см. также
предыдущий раздел) [16, 48, 50]. Для каждого агента вычисляется
его наилучший ответ на ту или иную игровую обстановку:
BRi(y-i) = Arg max fi(yi, y-i), y-i ? A-i, i ? N.
yi?Ai
Совокупность наилучших ответов определяет отображение
BR(y) = (BR1(y-1), …, BRn(y-n)), y ? A’. Равновесием Нэша называет-
ся точка x ? A’, удовлетворяющая уравнению x = BR(x). Следова-
тельно, множество равновесий Нэша есть
(5) E N = {x ? A’ | x = BR(x)}.
0


Определим для заданных уровней индивидуальной полезности
{ U i }i ? N следующие множества:
Bi( U i ) = {y ? A’ | fi(y) ? U i },
31
BRi(y-i, U i ) = {yi ? Ai | fi(yi, y-i) ? U i }, i ? N,
BR(y, U ) = (BR1(y-1, U1 ), …, BRn(y-n, U n )),
где U = ( U i )i ? N. Равновесием Нэша в рамках ОР1, следуя [30],
будем считать x = BR(x, U ), то есть
(6) E 1 (U ) = I Bi (U i ) = { x ? A’ | ? i ? N fi(x) ? U i },
N
i?I
то есть множество векторов действий агентов, каждый из которых
гарантирует каждому из агентов соответствующий уровень полез-
ности.
В рамках второго типа ограниченной рациональности класси-
ческое равновесие Нэша переходит в определение ?-равновесия
Нэша [16, 50]:
(7) E N (? ) = {y ? A’ | ? i ? N, ? yi ? Ai
2


fi(yiN, y-iN) ? fi(yi, y-iN) – ?i},
где ? = (?1, ?2, …, ?n).
Аналогично определяется равновесие Нэша и в рамках третье-
го типа ОР:
(8) E N ( ? ) = {y ? A’ | ? i ? N, ? yi ? Ai
3


fi(yiN, y-iN) ? (1 – ?i) fi(yi, y-iN)},
где ? = (?1, ?2, …, ?n).
Очевидно, что множества (7) и (8) содержат в себе «классиче-
ское» множество равновесий Нэша (5).
Рассмотренные в настоящем подразделе модели ограниченной
рациональности, во-первых, позволяют обобщить результаты
разделов 4.2 и 4.4 по постановке и решению задач институцио-
нального управления (управления ограничениями деятельности).
Так как данные обобщения являются чисто "техническими", при-
водить их в настоящей работе мы не будем. Во-вторых, модели
ограниченной рациональности будут использованы в пятом разде-
ле при постановке и решении задач управления нормами деятель-
ности.




32
5. УПРАВЛЕНИЕ НОРМАМИ ДЕЯТЕЛЬНОСТИ

В настоящем разделе формулируется и решается задача
управления нормами деятельности (подразделы 5.1-5.3) в предпо-
ложении, что информация о существенных параметрах является
общим знанием; затем исследуется влияние информированности
агентов (иерархии их взаимных представлений) на согласован-
ность норм деятельности и принципов рационального поведения
агентов (подраздел 5.4), что позволяет рассмотреть в подразделах
5.5-5.6 ряд прикладных моделей.


5.1. ПОСТАНОВКА ЗАДАЧИ УПРАВЛЕНИЯ НОРМАМИ
ДЕЯТЕЛЬНОСТИ

Пусть ОС состоит из n агентов, выбирающих действия yi ? Ai
из компактных множеств Ai и имеющих непрерывные целевые
функции fi(?, y), где ? ? ? – состояние природы, y = (y1, y2,
…, yn) ? A’ = ? Ai , i ? N, где N = {1, 2, …, n} – множество аген-
i?N
тов.
Нормой деятельности будем называть отображение
?: ? > A’ множества возможных состояний природы во множест-
во допустимых векторов действий агентов. Содержательно i-ая
компонента вектор-функции ?(?) определяет, какое действие i-го
агента от него ожидают остальные агенты и центр.
Пусть предпочтения центра заданы на множестве состояний
природы, норм деятельности и действий агентов: ?(?, ?(?), y).
Предполагая, что агенты следуют установленным нормам, обозна-
чим K(?(?)) = F?(?(?, ?(?), ?(?))) – эффективность институцио-
нального управления ?(?), где F?(?) – оператор устранения неопре-
деленности. В качестве оператора устранения неопределенности (в
зависимости от информированности центра) может использоваться
гарантированный результат по множеству ?, или математическое
ожидание по известному распределению вероятностей p(?) на
множестве ? и т.д. (см. методы устранения неопределенности в
разделе 4.1 и в [16, 29, 33]).
33
Тогда задачей институционального управления при ограниче-
ниях M? на нормы деятельности будет выбор допустимой нормы
?*(?) ? M?, имеющей максимальную эффективность:
(1) ?*(?) = arg max K(?(?)),
?( ? )?M ?
при условии, что агенты следуют установленным нормам деятель-
ности.
Последнее условие требует пояснений. Так как агенты актив-
ны и выбирают свои действия самостоятельно, то выбор агента
будет совпадать с выбором, предписываемым нормой, только в том
случае, если агенту это выгодно. Детализируем, что можно пони-
мать под «выгодностью».
По аналогии с моделями ограниченной рациональности, рас-
смотренными в разделе 4.5, определим параметрическое равнове-
сие Нэша [16] и рациональное поведение для каждого из трех
типов ограниченной рациональности:
(2) E N (? ) = {x ? A' | ? i ? N, ? yi ? Ai fi(?, x) ? fi(?, x-i, yi)},
0


(3) E N (? , U ) = {x ? A' | ? i ? N fi(?, x) ? U i },
1


(4) E N (? , ? ) = {x ? A' | ? i ? N, ? yi ? Ai fi(?, x) ? fi(?, x-i, yi) – ?i},
2


(5) E N (? , ? ) = {x ? A' | ? i?N, ? yi ? Ai fi(?, x) ? (1–?i) fi(?, x-i, yi)}.
3


Будем называть норму ?(?) согласованной с j-ым типом ра-
ционального поведения, j = 0,3 , если
(6) ? ? ? ? E N (?) ? ?(?) ? ?.
j


Условие (6) можно интерпретировать следующим образом:
норма деятельности реализует то или иное равновесие, если для
любого состояния природы, выбор, предписываемый нормой, не
противоречит рациональности поведения агентов (обеспечивает им
соответствующий выигрыш и/или делает невыгодным односторон-
нее отклонение от нормы). Если ?(?) – однозначное отображение,
что мы и будем предполагать в дальнейшем, то навязывание цен-
тром согласованной нормы деятельности может рассматриваться
как сужение множества равновесий (подсказка о существовании
фокальной точки и т.д. – см. обсуждение проблемы множественно-
сти равновесий в [16, 50]). С этой точки зрения управление норма-

34
ми деятельности можно рассматривать как задачу реализации
соответствия группового выбора (см. обзор результатов теории
реализуемости в [29, 40]), в которой ? ? ? является вектором
индивидуальных характеристик агентов. Такой аспект рассмотре-
ния представляется перспективным направлением дальнейших
исследований, но выходит за рамки настоящей работы.
Условия (2) и (6) совместно можно записать в следующем ви-
де: норма ?(?) является согласованной тогда и только тогда, когда
(7) ? ? ? ?, ? i ? N, ? yi ? Ai fi(?, ?(?)) ? fi(?, ???(?), yi).
Условие (7) означает, что норма согласована с интересами
агентов, если при любом состоянии природы каждому агенту
выгодно следовать норме деятельности при условии, что осталь-
ные агенты также следуют этой норме. Аналогичным условию (7)
образом можно записать и условия (3)-(5).
Рассмотрим, какой информированностью должны обладать
агенты для того, чтобы существовала согласованная норма. Легко
видеть, что условия игры – множество агентов, целевые функции,
допустимые множества, а также норма деятельности и состояние
природы должны быть общим знанием. Напомним, что общим
знанием в теории игр [37] называется факт, о котором: а) известно
всем игрокам; б) всем игрокам известно а); всем игрокам известно
б), и так далее до бесконечности.
Действительно, для вычисления параметрического равновесия
Нэша в рамках действующих норм деятельности каждый агент
должен быть уверен, что и остальные агенты вычислят то же рав-
новесие, что и он. Для этого он должен поставить себя на место
остальных агентов, моделирующих его поведение, и т.д. Одним из
способов создания общего знания является публичное сообщение
факта всем агентам, собранным вместе. Наверное, в том числе,
этим объясняется то, что для формирования корпоративной куль-
туры, корпоративных стандартов поведения и т.д. в современных
фирмах так много внимания уделяется неформальному общению
сотрудников, лояльности фирме и т.д., то есть созданию у работ-
ников впечатления принадлежности общему делу, разделения
общих ценностей и т.д. – все это нужно для существования общего
знания.


35
Таким образом, под задачей институционального управления,
как управления нормами деятельности, будем понимать задачу (1),
(7) поиска нормы, обладающей максимальной эффективностью на
множестве допустимых и согласованных норм.


5.2. РЕШЕНИЕ ЗАДАЧИ УПРАВЛЕНИЯ НОРМАМИ
ДЕЯТЕЛЬНОСТИ

Обозначим S? – множество норм (всевозможных отображений
?: ? > A'), удовлетворяющих условию (7) раздела 5.1. Тогда
задачу управления можно записать в виде:
(1) K(?(?)) > max ,
?( ?)?M ? ? S?
То есть, решение задачи управления нормами деятельности
заключается в следующем: 1) найти множество S? согласованных
норм; 2) найти множество S? ? M? норм, являющихся одновре-
менно согласованными и допустимыми; 3) выбрать из этого мно-
жества норму, обладающую максимальной эффективностью с
точки зрения центра. Первый этап решения задачи (1) является
задачей согласованного управления [29]. Высокая вычислительная
сложность этой задачи обусловлена тем, что искомыми перемен-
ными являются отображения ?: ? > A', поэтому исследуем ее
более подробно.
Пусть институциональное управление используется совместно
с мотивационным, в рамках которого целевая функция i-го агента
принимает вид:
(2) gi(?, y, ?i) = fi(?, y) + ?i(?, ?(?), y), y ? X, i ? N,
где ?i: ? ? M? ? A' > ?1 – функция стимулирования i-го агента.
+
Утверждение 2.
а) При использовании центром мотивационного управления
? s (? ,?? i (? )), yi = ?i (? )
(3) ?i(?, ?(?), y) = ? i , i ? N,
yi ? ?i (? )
? 0,
где
(4) si = max fi(?, ?-i(?), yi) – fi(?, ?(?)) + ?i, i ? N,
y i ? Ai


36
?i > 0 – сколь угодно малая строго положительная константа,
i ? N, норма ?(?) является согласованной;
б) Не существует другого мотивационного управления, реали-
зующего ?(?) как единственное равновесие Нэша игры агентов, и
требующего от центра строго меньших затрат на стимулирование.
Справедливость утверждения 2 обосновывается подстановкой
(2)-(4) в выражение (7) раздела 5.1.
Выражение (4) характеризует (в силу утверждения 2) мини-
мальные затраты центра на мотивацию i-го агента, побуждающего
последнего следовать норме деятельности ?(?). Сумма выражения
(4) по всем агентам
(5) С(?, ?(?)) = ? max fi(?, ?-i(?), yi) – ? fi(?, ?(?))
y i ? Ai
i?N i?N
есть ни что иное, как минимальные затраты центра на согласован-
ное (совместное институциональное и мотивационное) управление.
Поэтому, если целевую функцию центра ?(?, ?(?), y) представить в
виде разности дохода H(y) и затрат на управление С(?, ?(?)), то в
силу согласованности управления получим:

стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>