<<

стр. 2
(всего 2)

СОДЕРЖАНИЕ

(6) ?(?, ?(?)) = H(?(?)) – С(?, ?(?)).
Тогда эффективность институционального управления ?(?)
можно определить (см. также раздел 5.1) как
K(?(?)) = F?(H(?(?)) – С(?, ?(?))),
где F?(?) – оператор устранения неопределенности.
Задача институционального управления
(7) F?(H(?(?)) – С(?, ?(?))) > max
?( ? )?M ?
отличается от задачи (1) тем, что максимизация ведется по множе-
ству всех допустимых норм деятельности, а условие согласованно-
сти учтено в максимизируемом критерии1.
1
В качестве отступления отметим, что, так как норма деятельности предпо-
лагается однозначным отображением, то представляется, что использования
мотивационного управления с гибким планом (планом, зависящим от состояния
природы) оказывается достаточным. Другими словами, для любого институцио-
нального управления в рамках рассматриваемой модели найдется мотивационное
управление не меньшей эффективности. При этом процесс решения задачи
мотивационного управления намного проще процесса решения задачи институ-
ционального управления, так как в первом случае максимизация ведется по
множеству действий агентов, а не по множеству отображений.
37
5.3. УНИФИЦИРОВАННЫЕ НОРМЫ ДЕЯТЕЛЬНОСТИ

Частным случаем задачи институционального управления яв-
ляется ситуация, в которой центр должен использовать унифициро-
ванное управление, то есть управление, одинаковое для всех аген-
тов. Понятно, что эффективность унифицированного управления
не выше, чем рассмотренного выше персонифицированного (когда
в общем случае каждому агенту устанавливается своя норма дея-
тельности) [29, 32], поэтому исследуем потери в эффективности и
условия возможности использования унифицированного управле-
ния.
Для этого сначала в рамках моделей ограниченной рациональ-
ности, введенных выше, рассмотрим, каковы должны быть пороги
"чувствительности" агентов для того, чтобы любая норма деятель-
ности была реализуема.
Унифицированная норма ?U(?) = (?(?), ?(?), …, ?(?)) по опре-
делению (6) раздела 5.1 согласована с классическим равновесием
Нэша (см. выражение (2) раздела 5.1), если
(1) ? ? ? ? E N (?) ? ?U(?) ? ?.
0


Так как унифицированная норма предписывает всем агентам
выбор одинаковых действий, то понятно, что очень редко следова-
ние норме будет равновесием Нэша. Для того чтобы расширить
множество согласованных унифицированных норм, предположим,
что агенты следуют гипотезе ограниченной рациональности.
Определим для фиксированных x ? A' и ? ? ?
(2) Ui(?, x) = fi(?, x), i ? N.
(3) ?i(?, x) = max fi(?, x-i, yi) – fi(?, x), i ? N,
y i ? Ai

(4) ?i(?, x) = 1 – fi(?, x) / max fi(?, x-i, yi), i ? N,
y i ? Ai

Очевидно, что норма ?(?) согласована с j-ым типом рацио-
нального поведения, j = 1,3 , если ? ? ? ? выполнено, соответст-
венно
(5) U i ? Ui(?(?), ?), i ? N,
(6) ?i ? ?i(?(?), ?), i ? N,
(7) ?i ? ?i(?(?), ?), i ? N.
38
Выражения (5)-(7) являются "двойственными" выражениям
(3)-(5) раздела 5.1 в том смысле, что первые задают минимальные
пороги чувствительности, необходимые для согласованности норм
(выражения (6) и (7) позволяют вычислить гарантированные оцен-
ки ?i(?) = max ?i(?(?), ?), i ? N и ?i(?) = max ?i(?(?), ?), i ? N),
? ?? ? ??
а вторые определяют множество согласованных норм.
Определим параметры, аналогичные параметрам (2)-(7), для
случая унифицированных норм:
(8) UU(?, x) = max fi(?, x), x ? A', ? ? ?.
i?N

(9) ?U(?, x) = max [ max fi(?, x-i, yi) – fi(?, x)], x ? A', ? ? ?,
y i ? Ai
i?N

(10) ?U(?, x) = 1 – min [ fi(?, x) / max fi(?, x-i, yi)], x ? A', ? ? ?.
y i ? Ai
i?N

Унифицированная норма ?(?) согласована с j-ым типом ра-
ционального поведения, j = 1,3 , если ? ? ? ? выполнено, соот-
ветственно
(11) U i ? UU(?(?), ?), i ? N,
(12) ?i ? ?U(?(?), ?), i ? N,
(13) ?i ? ?U(?(?), ?), i ? N.
Обозначим M ?U – множество унифицированных норм дея-
тельности и сформулируем задачу синтеза унифицированной
нормы деятельности (см. также выражения (1) разделов 5.1 и 5.2):
(14) ?U (?) = arg max K(?(?)),
*
?( ?)?M ?U

при условии, что агенты следуют норме деятельности.
Детализации требует последнее условие. Агенты следуют
унифицированной норме, если последняя является согласованной.
Таким образом, мы доказали следующее утверждение.
Утверждение 3. В рамках j-го типа рационального поведения
агентов, j = 1,3 , решением задачи синтеза унифицированной нор-
мы деятельности является
(15) ?U (?) = arg
*
max K(?(?)).
?( ?)?{?( ? )?M ?U | (10 + j )}




39
Если задача синтеза унифицированной нормы деятельности
решается в предположении, что агенты выбирают равновесные по
Нэшу действия, то в (15) следует подставить выражение (12) с
?i = 0, i ? N.


5.4. РОЛЬ ИНФОРМИРОВАННОСТИ АГЕНТОВ1

Как отмечалось выше, для того, чтобы норма деятельности
реализовывала определенный вектор действий агентов как равно-
весие Нэша их игры необходимо, чтобы как сама норма, так и
состояние природы были общим знанием. Задача институциональ-
ного управления для этого случая рассмотрена в разделах 5.1-5.3,
поэтому исследуем ситуацию, когда состояние природы не являет-
ся общим знанием. При этом будем считать, что вся остальная
информация об игре и норме деятельности является общим знани-
ем.
Предположим, что информированность агентов описывается
информационной структурой где
I = (I1, I2, …, In),
Ii = (?i, ?ij, ?ijk, …), i, j, k ? N, – структура информированности i-го
агента, i ? N, ?i – его представления о состоянии природы, ?ij – его
представления о представлениях j-го агента, ?ijk – представления i-
го агента о том, что j-ый агент думает о представлениях k-го агента
и т.д. в общем случае до бесконечности [37]. Отметим, что введен-
ная модель может быть легко модифицирована для ситуации, в
которой все агенты адекватно информированы о состоянии приро-
ды, но придерживаются различных норм деятельности.
Если задана структура информированности I, то тем самым
задана и структура информированности каждого из агентов (как
реальных, так и фантомных – то есть существующих в сознании
других реальных и фантомных агентов). Выбор ?-агентом, где ? –
некоторая последовательность индексов из множества N, своего
действия x? в рамках гипотезы рационального поведения определя-
ется его структурой информированности I? , поэтому, имея эту
структуру, можно смоделировать его рассуждения и определить

1
Раздел написан совместно с А.Г. Чхартишвили.
40
его действие. Выбирая свое действие, агент моделирует действия
других агентов (осуществляет рефлексию). Поэтому при определе-
нии исхода игры необходимо учитывать действия как реальных,
так и фантомных агентов.
Обозначим ?+ – множество всевозможных конечных последо-
вательностей индексов из N, ? – объединение ?+ с пустой последо-
вательностью, |?| – количество индексов в последовательности ?
(для пустой последовательности принимается равным нулю).
Набор действий x?*, ? ? ?+, называется информационным рав-
новесием [37], если выполнены следующие условия:
1. структура информированности I имеет конечную сложность
?, то есть, дерево I содержит конечный набор попарно различных
поддеревьев [37];
2. ??, µ ? ? + I? = Iµ ? x?* = xµ*;
3. ? i ? N, ? ? ? ?
(1) x?i ? Arg max f i (??i , x?i1 ,..., x?i ,i ?1 , yi , x?i ,i +1 ,..., x?i , n ) .
* * * * *
y i ? Ai
Запишем условия (1) в терминах норм деятельности:
(2) ? i ? N, ? ? ? ? ?i(??i) ? Arg max fi(??i, ?1(??i1), …
y i ? Ai

…,?i-1(??i,i-1), yi, ?i+1(??i,i+1), …, ?n(??i,n)).
Структура информированности является бесконечным дере-
вом, отражающим иерархию представлений агентов в рефлексив-
ной игре [37]. Информационное равновесие (1) (как решение реф-
лексивной игры) существует в случае, если структура
информированности конечна. Конечность информационной струк-
туры по своему определению означает не конечность ее дерева, а
существование конечного базиса, в рамках которого рассмотрение
фантомных агентов, имеющих ту же информированность, что и
другие реальные или фантомные агенты, не дает новой информа-
ции и поэтому нецелесообразно.
Если априори имеется (например, построено исходя из содер-
жательных соображений) конечное дерево, отражающее несколько
первых уровней представлений агентов, то в общем случае нельзя
однозначно сказать какой бесконечной информационной структуре
оно соответствует. Другими словами, может существовать множе-

41
ство информационных структур, любое конечное число верхних
уровней которых совпадает.
Поэтому для определения информационного равновесия по
конечному дереву представлений агентов необходимо введение
дополнительных предположений. Например, можно постулиро-
вать, что каждый фантомный агент, соответствующий нижнему
уровню конечного дерева представлений, при определении своего
действия считает, что агент, соответствующий предыдущему
уровню иерархии, адекватно информирован о нем.
Далее будем рассматривать регулярные структуры информи-
рованности [37], обладающие, в частности, тем свойством, что,
если задано конечное дерево представлений и известно, что ин-
формационная структура регулярна, то информационное равнове-
сие определяется однозначно. Для регулярных структур информи-
рованности удается: получить конструктивные условия
существования информационного равновесия, исследовать зави-
симость информационного равновесия от структуры информиро-
ванности, поставить и решить задачу рефлексивного управления
[37].
Для задания регулярных структур информированности вве-
дем вспомогательное понятие регулярного конечного дерева (РКД),
которое определим рекуррентно.
Пусть в игре участвуют n агентов. Если (в простейшем случае)
все агенты одинаково информированы, то структура информиро-
ванности имеет сложность n и единичную глубину. Будем изобра-
жать эту ситуацию в виде дерева, состоящего из корневой верши-
ны, n ребер и n висячих вершин.
Далее РКД может «расти» следующим образом: к каждой ви-
сячей вершине ?i, ? ? ?, присоединяется ровно (n – 1) ребро, при
этом возникает (n – 1) висячая вершина ?ij, j = 1, …, i –
1, i + 1, …, n. Построенное РКД будем интерпретировать так: если
имеется висячая вершина ?i, ? ? ?, то ?i-агент одинаково
информирован с ?-агентом (если ? – пустая последовательность, то
?i-агент является реальным, и его субъективные представления
совпадают с объективными).
Напомним, что, во-первых, максимальная глубина ki РКД i-го
реального агента в [37] названа рангом его рефлексии. Во-вторых,
42
любая конечная регулярная информационная структура однознач-
но (с учетом аксиомы автоинформированности – ? i ? N
? ?, ? ? ? ??ii? = ??i? [37]) задается перечислением своих висячих
вершин.
Обозначим множество параметрических (параметр – вектор
? = (?1, ?2, …, ?n) ? ? n) равновесий Нэша
(3) EN(?) = {{xi(?)}i ? N ? A’ | ? i ? N, ? yi ? Ai
fi(?i, x1(?), …, xn(?)) ? fi(?i, x1(?), …, xi-1(?), yi, xi+1(?), …, xn(?))},
а объединение этих множеств по всевозможным субъективным
представлениям о значении состоянии природы обозначим
U EN (?1 ,? 2 , ..., ? n ) . Вычисление объединения (по со-
EN =
(? 1 ,? 2 , ..., ? n )?? n

стояниям природы) множеств равновесий имеет смысл с двух
точек зрения. Во-первых, при рассмотрении задачи о максималь-
ном целесообразном ранге рефлексии некоторого реального агента
требуется определить минимальный ранг рефлексии, при котором
он охватывает все многообразие своих выигрышей в рефлексивной
игры, а выигрыши зависят, в том числе, и от состояния природы.
Во-вторых, при постановке прямой или обратной задачи информа-
ционного управления (когда центр целенаправленно формирует
структуры информированности агентов) необходимо учитывать
все равновесия, возможные при различных допустимых структурах
информированности (всевозможных допустимых комбинациях
значений неопределенных параметров на всех уровнях структуры
информированности).
Предположим, что на нижнем уровне {??ij}j ? N конечной регу-
лярной структуры информированности имеет место субъективное
общее знание фантомных агентов. Тогда с точки зрения ?i-агента
возможными являются равновесия их игры из множества
EN({??ij}j ? N).
Введем множество наилучших ответов i-го агента на выбор
оппонентами действий из множества X-i при множестве ? возмож-
ных состояний природы:
U Arg max fi (? , xi , x?i ) , i ? N,
(4) BRi(?, X-i) =
x i ? Ai
x ?i ? X ?i , ? ??

а также следующие величины и множества:

43
U EN (? ) ,
(5) EN =
? ?? n

(6) X i0 = Proji EN, i ? N,
? X ik , i ? N, k = 0, 1, 2, …,
k
(7) X ? i =
j ?i
где
(8) X ik = BRi(?, X ? i?1 ), k = 1, 2, … , i ? N.
k


Отображение BRi(?, ?): ? ? A-i > Ai называется рефлексивным
отображением i-го агента, i ? N [37].
В [37] доказано1, что X ik ? X ik +1 , k = 0, 1, … , i ? N, то есть с
ростом ранга рефлексии множества (8) возможных наилучших
ответов агентов не сужаются.
Рефлексивное отображение i-го агента называется стационар-
ным, если X ik = X ik +1 , k = 0, 1, … .
В [37] доказано, что, если рефлексивные отображения агентов
стационарны, то максимальный целесообразный субъективный
ранг рефлексии равен двум и множество действий i-го агента,
которые могут быть реализованы как компоненты информацион-
ного равновесия, составляет X i0 , i ? N. При этом множество ин-
? X i0 .
формационных равновесий составляет E =
i?N
Данный факт имеет чрезвычайно важное значение по следую-
щим причинам. Если рефлексивные отображения агентов стацио-
нарны2, то, во-первых, каждый агент может ограничить свои рас-
суждения вторым рангом рефлексии (третьим уровнем
регулярного дерева информационной структуры), так как для
любого большего ранга рефлексии и для любого соответствующе-
го этому рангу информационного равновесия найдется структура
информированности глубины три, информационное равновесие
1
Отметим, что в указанной работе рассматривался случай двух реальных
агентов. В настоящей же работе строится модель взаимодействия произволь-
ного конечного числа реальных агентов.
2
На сегодняшний день не существует конструктивных достаточных условий
стационарности рефлексивных отображений. Их поиск является перспективной
задачей будущих исследований, выходящей за рамки настоящей работы.
44
при которой совпадет с исходным. Во-вторых, центру не имеет
смысла навязывать агентам сложные структуры информированно-
сти, имеющие глубину четыре и более, так как множество дейст-
вий агентов, реализуемых как информационные равновесия, при
этом не расширяется. Итак, стационарность рефлексивных ото-
бражений привлекательна как с точки зрения центра, так и с точки
зрения агентов. Но особенно привлекательна она с точки зрения
исследователя, так как позволяет существенно упростить поста-
новку и решение задачи информационного управления – предста-
вить себе и описать ситуацию, а тем более решить задачу управле-
ния для случая, когда центр должен сформировать структуру
информированности глубины, например, сто, затруднительно, если
не невозможно.
Отметим, что выше утверждается, что при стационарных реф-
лексивных отображениях множество равновесных действий i-го
(реального) агента составляет X i0 , i ? N. Казалось бы, это множе-
ство может быть реализовано информационной структурой еди-
ничной глубины, в которой субъективные представления агентов
являются общим знанием (см. выражения (3), (5) и (6)). Для от-
дельного агента это так, но множество равновесий при этом будет
EN. Для того чтобы реализовать более широкое множество E ? EN
информационных равновесий требуется структура информирован-
ности глубины два. Действительно, формируя у i-го агента (неза-
висимо от других агентов) конечную регулярную информацион-
ную структуру Ii = (?i, ?ij), при всевозможных ?i, ?ij ? ? центр
может побудить его выбрать как субъективно равновесное дейст-
вие любую точку множества X i0 , i ? N. Так как информационное
воздействие производится на агентов независимо, то множеством
возможных исходов является декартово произведение множеств
X i0 , i ? N, то есть множество E.
Как отмечалось выше, если рефлексивные отображения аген-
тов стационарны, то максимальный целесообразный субъективный
ранг рефлексии равен двум, а глубина структуры информирован-
ности, соответственно трем. При этом речь идет о такой мини-
мальной глубине структуры информированности агента, при кото-
рой он может "увидеть" реализацию наихудшей для него ситуации.
45
Содержательно, центру необходимо обеспечить независимый
выбор реальными агентами (первый уровень структуры информи-
рованности) компонент информационного равновесия. Для этого с
их точки зрения должны быть реализуемы любые обстановки
(второй уровень), для чего, в свою очередь требуется равновесие
на более глубоком (третьем) уровне.
Таким образом, при стационарных рефлексивных отображе-
ниях с точки зрения центра при осуществлении информационного
(рефлексивного) управления достаточно ограничиться структурами
информированности агентов глубины два (то есть графами рефлек-
сивной игры [37] вида ?i - ?ij), а с точки зрения агентов – структу-
рами информированности агентов глубины три (то есть графами
рефлексивной игры [37] вида ?i < ?ij - ?ijk).
Так как в настоящем разделе нас интересует роль информиро-
ванности агентов с позиции институционального управления,
осуществляемого центром, то будем исследовать воздействия на
первые два уровня структуры информированности (воздействие на
третий уровень, по-видимому, может оказаться существенным для
стабильности информационного управления [36, 37]).
Рассмотрим обратную задачу информационного управления:
пусть задан вектор x* ? A' действий агентов, требуется найти мно-
жество I(x) структур информированности, при которых данный
вектор действий является информационным равновесием в смысле
(1). Имея решение этой задачи, можно ставить и решать множество
других задач управления – как институционального, так и инфор-
мационного, например, совместного определения информационной
структуры и нормы, реализующих заданные действия агентов, и
др.
Так как в настоящей работе мы ограничиваемся случаем ста-
ционарных рефлексивных отображений, то достаточно искать
структуры информированности в классе двух- или трехуровневых,
которые однозначно задаются последовательностями ?ij ? ? или,
соответственно, ?ijk ? ?, i, j, k ? N.
Рассмотрим i-го реального агента, который в силу рациональ-
ности его поведения вычисляет
(9) xi* ? Arg max fi(?i, xi*1 , …, xi*,i ?1 , yi, xi*,i +1 , …, xin ), i ? N,
*
y i ? Ai


46
и моделирует действия своих оппонентов (фантомных ij-агентов,
j ? N, первого уровня) в соответствии с (1):
(10) xij ? Arg max fj(?ij, xij1 , …, xij , j ?1 , yj, xij , j +1 , …, xijn ), j ? N,
* * * * *
y j ?A j

и т.д.
Для того чтобы показать, каким образом "обрывается" цепочка
наращивания уровней рефлексии, предположим, что регулярная
структура информированности имеет глубину, равную трем, то
есть содержит только последовательности вида ?i, ?ij и ?ijk,
i, j, k ? N. Такая структура информированности подразумевает, что
для каждых i ? N, j ? N, фантомные ijk-агенты, k ? N, разыгрывают
равновесие Нэша (см. также (3)) с общим знанием ?ij = {?ijk}k ? N:
(11) EN(?ij) = {x({?ijk}k ? N) ? A’ | ? k ? N, ? yk ? Ak
fk(?ijk, x1(?ij), …, xn(?ij) ?
? fk(?ijk, x1(?ij), …, xk-1(?ij), yk, xk+1(?ij), …, xn(?ij))}.
Таким образом, при заданной структуре информированности i-
ый агент (реальный) вычисляет сначала в соответствии с (11)
равновесные действия xijk = xk(?ij) фантомных ijk-агентов, j ? N,
*


k ? N. Затем он подставляет их в (10), вычисляя равновесные дей-
ствия фантомных ij-агентов, j ? N, а затем уже находит в соответ-
ствии с (9) множество своих равновесных (с его субъективной
точки зрения) действий.
До сих пор, решая задачу определения информационного рав-
новесия, мы двигались по дереву информационной структуры
"снизу вверх", что позволило определить множество E = ? X i0
i?N
действий реальных агентов, реализуемых как информационное
равновесие при регулярных структурах информированности и
стационарных рефлексивных отображениях. Теперь можно, двига-
ясь "сверху вниз", решать обратную задачу информационного
управления
Условия (9) позволяют для каждого агента i ? N и каждого его
действия xi ? X i0 определить множество тех обстановок игры x-
? A-i, на которые данное действие является наилучшим ответом
i
при некотором представлении ?i ? ? рассматриваемого агента о
состоянии природы:
47
(12) Pi(xi) = {x-i ? A-i | ? ?i ? ?: xi ? BRi(?i, x-i)}, xi ? X i0 , i ? N,
где BRi(?i, x-i) = Arg max fi(?i, x-i, yi), x-i ? A-i, ?i ? ?, i ? N.
y i ? Ai
Введем многозначное отображение
(13) P(x) = I Pi ( x ) .
i?N
Очевидно, множество {x ? A' | x ? P(x)} ? A' является ни чем
иным, как множеством EN (см. выражение (5)), то есть объединени-
ем множеств «классических» параметрических равновесий Нэша
(3) игр агентов, в которых информация ? ={?1, ?2, …, ?n} об инди-
видуальных представлениях агентов о значениях ?i ? ?, i ? N,
является общим знанием.
Перейдем к рассмотрению собственно влияния информиро-
ванности агентов на управление нормами деятельности. Выше
норма для i-го агента была определена как отображение его ин-
формированности во множество его действий, а информированно-
стью являлось знание о значении неопределенного параметра –
состояния природы ? ? ?. В случае, когда каждый агент обладает
иерархией представлений, его информированность описывается
структурой Ii его информированности. Поэтому далее, в отличие от
разделов 5.1-5.3 и от выражения (2), нормой для i-го агента будем
считать ?i(Ii) ? Ai, i ? N, а нормой деятельности коллектива аген-
тов – отображение информационной структуры во множество
действий всех агентов: ?(I) = (?1(I1), ?2(I2), …, ?n(In)).
Рассмотрим последовательно (в порядке возрастания сложно-
сти) различные возможности центра по формированию структур
информированности агентов.
Вариант I. Пусть центр осуществляет унифицированное (од-
нородное) информационное регулирование [14, 36], то есть, струк-
тура информированности i-го агента есть Ii = ?, i ? N, ? ? ? и
сообщаемое центром значение состояния природы ? является
общим знанием. Фрагмент (для i-го и j-го агентов) графа соответ-
ствующей рефлексивной игры имеет вид ? - ? и не зависит от
рассматриваемых агентов. Отметим, что такая информированность
совпадает с рассмотренной выше в разделах 5.1-5.3 (информация о
состоянии природы является общим знанием).

48
Тогда множество всевозможных информационных равновесий
игры агентов есть
(14) E N = U EN(?, ?, …, ?).
0

? ??
Очевидно, имеет место:
(15) E N ? EN ? E ? A'.
0


Фиксируем вектор x1 ? E N
0
действий агентов. Обозначим
? 1(x1) – такое множество допустимых значений параметра ? ? ?,
при котором вектор x1 действий является параметрическим равно-
весием Нэша (решение обратной задачи информационного управ-
ления):
(16) ? 1(x1) = {? ? ? | ? i ? N, ? yi ? Ai fi(?, x1) ? fi(?, x1 i , yi)},
?

X1(?) – множество векторов действий, удовлетворяющих следую-
щему условию
? i ? N, ? yi ? Ai fi(?, x1) ? fi(?, x1 i , yi), ? ? ?.
?
Так как информированностью агента является ? ? ?, то полу-
чаем, что в рассматриваемом варианте I норма ?1(?) является со-
гласованной, если
(17) ? ? ? ?, ? i ? N ?1i(?) ? Proji X1(?),
а унифицированная норма ?U(?) – см. раздел 5.3 – является согла-
сованной, если
(18) ? ? ? ?, ? i ? N ?1U(?) ? Proji X1(?).
Отметим, что сообщение центром норм деятельности, отра-
жающих прогнозируемые состояния системы, может рассматри-
ваться как активный прогноз, для которого применимы все резуль-
таты, приведенные в [36].
Вариант II. Пусть центр осуществляет персонифицированное
информационное регулирование [14, 36], то есть, структура ин-
формированности i-го агента есть Ii = ?i, ?i ? ?, i ? N, и индивиду-
альные представления агентов о состоянии природы являются
общим знанием. Фрагмент (для i-го и j-го агентов) графа соответ-
ствующей рефлексивной игры имеет вид ?i - ?j.
Тогда множество всевозможных информационных равновесий
игры агентов есть EN, то есть шире, чем в первом варианте.

49
Фиксируем вектор x2 ? EN действий агентов. Обозначим
? 2(x2) – такое множество значений векторов параметров ? 2 ? ? n,
при котором вектор x2 действий является параметрическим равно-
весием Нэша (решение обратной задачи информационного управ-
ления):
(19) ? 2(x2) = {? 2 ? ? n | ? i ? N, ? yi ? Ai fi(?i2, x2) ? fi(?i2, x? i , yi)},
2


X2(?) – множество векторов действий, удовлетворяющих следую-
щему условию
? i ? N, ? yi ? Ai fi(?i2, x2) ? fi(?i2, x? i , yi), ? 2 ? ? n.
2


Так как информированностью агента является вектор ? 2 ? ? n,
то получаем, что в рассматриваемом варианте II норма ? 2(?) явля-
ется согласованной, если
(20) ? ? 2 ? ? n, ? i ? N ?i2(? 2) ? Proji X2(? 2),
а унифицированная норма ? 2U(?) является согласованной, если
(21) ? ? 2 ? ? n, ? i ? N ? 2U(? 2) ? Proji X2(? 2).
Сравнивая (17)-(18) и (20)-(21), в силу (15) получаем, что во
втором варианте множество согласованных (и, в том числе, уни-
фицированных) норм не уже, чем множество согласованных (и, в
том числе, унифицированных) норм в первом варианте1.
Рассмотренные варианты I и II исчерпывают регулярные
структуры информированности единичной глубины. Поэтому
рассмотрим регулярные структуры информированности глубины
два.
Вариант III. Пусть центр осуществляет рефлексивное управле-
ние [36], сообщая каждому агенту информацию о неопределенном
параметре, а также то, что о значениях этого параметра думают
("знают") остальные агенты, то есть, структура информированно-
сти i-го агента есть Ii = {?i, ?ij}, ?i, ?ij ? ?, i, j ? N. Фрагмент (для i-
го агента) графа соответствующей рефлексивной игры имеет вид
?i - ?ij.


1
Так как в различных рассматриваемых вариантах нормы деятельности ото-
бражают во множество действий агентов различные пространства (в первом
варианте ? 1: ? > A', во втором – ? 2: ? n > A' и т.д.), то "сравнение" мно-
жеств согласованных норм следует понимать в смысле вложенности соответ-
ствующих прообразов.
50
Тогда множество всевозможных информационных равновесий
игры агентов есть E, то есть шире, чем в первом и во втором вари-
анте.
Фиксируем вектор x3 ? E действий агентов. Обозначим
?i3 ( xi3 ) – такое множество значений векторов параметров
? i3 = (?i, {?ij}j ? i) ? ? n, при котором вектор действий ( xi3 , y? i ), где
3


? X 0j ,
y? i ?
3
является информационным равновесием (решение
j ?i
обратной задачи информационного управления) с точки зрения i-го
агента:
(22) ?i3 ( xi3 ) = { ? i3 ? ? n | ? y? i ? ? X 0 :
3
j
j ?i

? yi ? Ai fi(?i, xi3 , y? i ) ? fi(?i, yi, y? i ),
3 3


? j ? i, ? yj ? Aj fj(?ij, xi3 , y ?i ) ? fj(?ij, xi3 , y? i ? j , yj)},
3 3


X i3 ( ? i3 ) – множество векторов действий, удовлетворяющих сле-
дующему условию
? y? i ? ? X 0 : ? yi ? Ai fi(?i, xi3 , y? i ) ? fi(?i, yi, y? i ),
3 3 3
j
j ?i

? j ? i, ? yj ? Aj fj(?ij, xi3 , y ?i ) ? fj(?ij, xi3 , y? i ? j , yj), ? i3 ? ? n.
3 3


Существенным является то, что для каждого из агентов мно-
жества (22) могут вычисляться независимо.

Утверждение 4. а) ? i ? N, ? ? i3 ? ? n X i3 ( ? i3 ) = Proji X 2( ? i3 );
б) ? i ? N,? xi3 ? X i0
(23) ?i3 ( xi3 ) = ? 2(x2).
U
{ x 2 ?E | x i2 = x i3 }

Справедливость утверждения 4 следует из определений мно-
0
жеств EN, E N и E, и выражений (19) и (22).
Из утверждения 4 вытекает, что для решения обратной задачи
информационного управления в варианте 3 достаточно найти в
общем виде решение обратной задачи информационного управле-
ния в варианте 2, а затем воспользоваться выражением (23).
51
Так как информированностью i-го агента является вектор
? ? ? n, то получаем, что в рассматриваемом варианте III норма
3
i

?3 (?) является согласованной, если
i

(24) ? ? i3 ? ? n, ?3 ( ? i3 ) ? X i3 ( ? i3 ),
i

а унифицированная норма ?Ui (?) является согласованной, если
3


(25) ? ? i3 ? ? n, ? 3U( ? i3 ) ? X i3 ( ? i3 ).
Так как индивидуальные нормы деятельности могут назна-
чаться агентам независимо, то из утверждения 4 и сравнения вы-
ражений (20) и (24) получаем, что справедливо следующее утвер-
ждение.
Утверждение 5. В случае рефлексивного управления (вариант
III) множество согласованных индивидуальных норм деятельности
совпадает с множеством согласованных индивидуальных норм
деятельности в случае персонифицированного информационного
регулирования (вариант II).
Вариант IV. Альтернативой варианту III является следующий:
центр формирует у i-го агента (например, путем публичного сооб-
щения значения параметра ? ? ?, а затем частного сообщения
значения параметра ?i ? ?) структуру информированности
Ii = (?i, {?ij = ?}j ? i). Обозначим ? i4 = (?i, ?) ? ? 2, i ? N.
Фрагмент (для i-го агента) графа соответствующей рефлек-
сивной игры имеет вид ?i < ? - ?. Множество равновесий Нэша
игры фантомных агентов второго и третьего уровня структуры
информированности есть EN(?, ?, …, ?) – см. выражение (3), при-
чем это множество могут вычислить все агенты. Следовательно,
X i4 (?i, ?) = BRi(?i, EN(?, ?, …, ?)). Обозначим множество возмож-
ных информационных равновесий в рассматриваемом варианте
(26) E4 = U {y ? A' | yi ? U X i4 (?i, ?)}.
? ?? ? i ??

Фиксируем вектор x4 ? A' действий агентов. Обозначим ? 4(x4)
такое множество значений векторов параметров

({?i}i ? N, ?) ? ? , при котором данный вектор действий является
n+1




52
информационным равновесием (решение обратной задачи инфор-
мационного управления):
(27) ? 4(x4) = {({?i}i ? N, ?) ? ? n + 1 | ? i ? N
xi4 ? BRi(?i, EN(?, ?, …, ?))}.
Так как информированностью i-го агента является вектор
? i ? ? 2, то получаем, что в рассматриваемом варианте IV норма
4


?i4 (?) является согласованной, если
(28) ? ? i4 ? ? 2, ?i4 ( ? i4 ) ? X i4 ( ? i4 ),
а унифицированная норма ?Ui (?) является согласованной, если
4


(29) ? ? i4 ? ? 2, ? 4U( ? i4 ) ? X i4 ( ? i4 ).
Отметим, что в общем случае множество E4, то есть множест-
во векторов x4 ? A', для которых ? 4(x4) ? ?, может отличаться от
0
любого из множеств EN, E N и E. Единственно, можно с уверенно-
? Proji E N
стью утверждать, что E4 ? E, ? E4.
0

i?N
Итак, в случае стационарных рефлексивных отображений рас-
смотренные четыре варианта информационных воздействий ис-
черпывают все многообразие возможных информационных равно-
весий. Наверное, при воздействии центра на более глубокие
(третий, четвертый и т.д.) уровни структуры информированности
агентов, множества согласованных норм деятельности могут "рас-
ширяться". Однако так как нормы являются отображением струк-
тур информированности в действия, сравнивать множества согла-
сованных норм при структурах информированности различной
глубины затруднительно, поэтому ограничимся описанными выше
четырьмя вариантами.
Результаты исследования обратных задач информационного
управления для четырех рассмотренных вариантов позволяют
сделать вывод, что с точки зрения множеств информационных
равновесий эти варианты соотносятся следующим образом:
(30) I ? II ? III, IV ? III, II ? IV; II ? IV ? ?,
а с точки зрения множеств согласованных норм:
(31) I ? IV ? III = II.
Сформулируем этот важный вывод в виде утверждения.
53
Утверждение 6. В случае стационарных рефлексивных ото-
бражений третий вариант информационного воздействия (форми-
рование информационной структуры вида ?i - ?ij, i, j ? N) харак-
теризуется максимально широкими множествами как
информационных равновесий, так и согласованных норм.
Таким образом, третий вариант характеризуется максимально
широкими множествами как информационных равновесий, так и
согласованных норм, поэтому именно этот вариант, как дающий
центру наибольшие возможности управления, следует рассматри-
вать в первую очередь, как при построении теоретических моде-
лей, так и при реализации институционального и информационно-
го управления на практике.
Полученные в настоящем разделе условия согласованности
норм деятельности и решения обратных задач информационного
управления позволяют ставить и решать широкий круг задач –
примерами служат рассматриваемые ниже прикладные модели
управления нормами деятельности.


5.5. ПРИМЕР УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ:
"АККОРДНАЯ ОПЛАТА ТРУДА"1

Рассмотрим ОС, состоящую из центра и n агентов, осуществ-
ляющих совместную деятельность.
Стратегией i-го агента является выбор действия yi ? Ai = ?1 ,
+
i ? N, стратегией центра – выбор системы стимулирования, опре-
деляющей размер вознаграждения каждого агента в зависимости от
результата их совместной деятельности. Предположим, что техно-
логия взаимодействия агентов такова, что для достижения требуе-
мого результата необходимо, чтобы сумма их действий была не
меньше заданной величины ? ? ?. В этом случае i-ый агент полу-
чает от центра фиксированное вознаграждение ?i, i ? N, в случае
же ? yi < ? вознаграждения всех агентов равны нулю.
i?N




1
Раздел написан совместно с А.Г. Чхартишвили.
54
Выбор действия yi ? 0 требует от i-го агента затрат ci(y, ri), где
ri > 0 – его тип (параметр, описывающий индивидуальные харак-
теристики), i ? N.
Относительно функций затрат агентов предположим, что
ci(y, ri) – непрерывная возрастающая по yi и убывающая по ri функ-
ция, причем ? y-i ? A-i, ? ri > 0 ci(0, y-i, ri) = 0, i ? N.
Определим множество индивидуально рациональных дейст-
вий агентов
(1) IR = {y ? A' | ? i ? N ?i ? ci(ri)}.
В случае, если затраты агентов сепарабельны, то есть затраты
ci(yi, ri) каждого агента зависят только от его собственных действий
и не зависят от действий других агентов, получаем, что
IR = ? [0; yi+ ] , где
i?N
+
max {yi ? 0 | ci(yi, ri) ? ?i}, i ? N.
(2) yi=
Обозначим
(3) Y(?) = {y ? A' | ? yi = ?},
i?N

? ci ( y, ri ) .
*
(4) Y (?) = Arg min
y?Y (? ) i?N
Рассмотрим последовательно различные варианты информи-
рованности агентов о значении параметра ? ? ?.
Вариант I. Предположим, что значение ?? ? является общим
знанием. Тогда равновесием игры агентов является параметриче-
ское равновесие Нэша, принадлежащее множеству равновесий
Нэша:
(5) EN(?) = IR ? Y(?).
Определим также множество эффективных по Парето дейст-
вий агентов:
(6) Par(?) = IR ? Y*(?).
Так как ? ? ? ? Y*(?) ? Y(?), то из (5) и (6) следует, что мно-
жество эффективных по Парето действий является одним из рав-
новесий Нэша. Но множество равновесий Нэша может оказаться
шире – в частности, при ? ? max yi+ оно всегда содержит вектор
i?N
нулевых действий.

55
Отметим, что множество (6) Парето-эффективных действий
может быть сделано непустым за счет мотивационного управле-
ния, то есть выбора соответствующего вектора вознаграждений
{?i}.
Из того, что ? ? ? ? Par(?) ? EN(?) следует, что любая норма
деятельности ?(?), для которой выполнено
(7) ? ? ? ? ?(?) ? Par(?),
является одновременно и согласованной, и эффективной по Паре-
то. Содержательно, при использовании нормы, удовлетворяющей
(7), центр указывает агентам среди достаточно широкого множест-
ва равновесий Нэша (при том, что каждому агенту наиболее выго-
ден выбор минимального действия, принадлежащего соответст-
вующей проекции множества равновесий Нэша (5)) конкретную
точку, которая является эффективной по Парето, то есть миними-
зирует суммарные затраты агентов по достижению требуемого
результата.
Приведем пример. Пусть имеются n = 2 агента с функциями
затрат типа Кобба-Дугласа: ci(yi, ri) = ri ?(yi / ri), где ?(?) – гладкая
монотонно возрастающая выпуклая функция, удовлетворяющая
?(0) = 0.
Тогда эффективной по Парето является единственная точка:
y*(?) = { yi* (?)}, где yi* (?) = ? ri / ? rj , i ? N.
j?N

Вычислим yi+ = ri ? -1(?i / ri), i ? N, тогда при
? rj ), i ? N,
(8) ?i ? ri ?(? /
j?N
множество Парето не пусто (причем множество Парето при раз-
личных ? ? ? составляет отрезок прямой с углом наклона, равным
отношению типов агентов) и согласованной является норма
?i(?) = yi* , i ? N.
Множества равновесий Нэша в рассматриваемом примере для
двух значений ?: ?2 > ?1 приведены на рисунке 2 (точка (0; 0)
является равновесием Нэша в обоих случаях).



56
y2
?2
?1
+
y2
EN(?2)
EN(?1)
y*(?1)

y*(?1)




tg(?) = r2/r1
y1
?1 ?2
y1+
0

Рис. 2. Параметрическое равновесие Нэша игры агентов

Итак, мы рассмотрели первый вариант информированности
агентов, соответствующий ситуации, когда значение параметра
? ? ? является общим знанием. Рассмотрим следующий (в порядке
возрастания сложности структуры информированности агентов –
см. раздел 5.4) вариант информированности, в рамках которого
общим знанием являются индивидуальные представления {?i}
агентов о значении параметра ? ? ?.
Вариант II. Предположим, что представления агентов о неоп-
ределенном параметре попарно различны (и при этом являются
общим знанием). Не ограничивая общности, занумеруем агентов
таким образом, чтобы их представления возрастали: ?1 < … < ?n.
Структура возможных равновесий в этой ситуации описывается
следующим утверждением.
Утверждение 7. В игре «аккордная оплата труда», для которой
?i ? ?j при i ? j, равновесными (в зависимости от соотношения
между параметрами) могут быть следующие (n + 1) исходов:
{y* | yi* = 0, i ? N}; {y* | yk = ?k , yi* = 0, i ? N, i ? k}, k ? N. Содер-
*


57
жательно это означает следующее: либо никто не работает, либо
работает один k-й агент, выбирая действие ?k.
Доказательство утверждения 7. Пусть вектор действий
*
*
y = ( y1 , …, yn ) является равновесием (очевидно, при этом
*


yi* ? yi+ для любого i ? N). Пусть существует такое k ? N, что
? yi* = ?k .
*
yk > 0. Покажем, что в этом случае
i?N

?y < ?k, то k-ый агент не рассчитывает
*
Действительно, если i
i?N
на получение вознаграждения и, следовательно, может увеличить
свой (субъективно ожидаемый) выигрыш с отрицательного до
нулевого, выбрав нулевое действие. Если же ? y i* > ?k, то k-ый
i?N
агент рассчитывает на получение вознаграждения, однако он мо-
*
жет увеличить свой выигрыш, выбрав вместо y k действие
? yi*
? yi* } < yk* .
max {0, ?k – ? ?k k-ый
Таким образом, при
i?N
i?N \{k }
агент может увеличить свой выигрыш, что противоречит равно-
весности вектора y*.
Мы показали, что, если yk > 0, то ? y i* = ?k. Но в силу усло-
*

i?N
вия ?i ? ?j, i ? j, это равенство может выполняться лишь для одного
k ? N. Поэтому если yk > 0, то yi* = 0 для всех i ? k. При этом,
*


очевидно, yk = ?k. Утверждение 7 доказано.
*


Рассмотрим теперь вопрос о том, при каких соотношениях
между параметрами ?i, yi+ , i ? N, реализуется каждое из равнове-
сий, перечисленных в формулировке утверждения 7.
Вектор (0, …, 0) является равновесным в случае, когда ника-
кой i-ый агент не может собственными усилиями выполнить дос-
таточную (с его точки зрения) для получения вознаграждения
работу (либо это усилие составляет в точности yi+ , так что выиг-
рыш i-го агента остается нулевым). Это условие формально запи-
сывается следующим образом: yi+ ? ?i для любого i.
58
Вектор {y* | yk = ?k , yi* = 0, i ? k} является равновесным, если
*

+
?k ? yk , а все агенты с номерами i > k, считая, что вознаграждения
не будет, являются недостаточно эффективными, чтобы собствен-
ными усилиями компенсировать величину ?i – ?k. Формально:
?k + yi+ ? ?i для любого i > k.
Возможные равновесия в игре двух агентов изображены на
рисунке 3. Заметим, что, в отличие от варианта I, существует об-
ласть, в которой равновесие отсутствует.

+
y2

(0, ?2)

?2




?
(0, 0)

?2 – ?1
(?1, 0)


y1+
0 ?1

Рис. 3. Равновесия в игре двух агентов
(область, где равновесия нет, обозначена символом «?»)

Рассмотрим теперь общий случай, когда представления аген-
тов могут и совпадать: ?1 ? … ? ?n. В этом случае может появиться
целая область равновесий, аналогично варианту I. Пусть, напри-
мер, выполняются соотношения ?m = ?m+1 = … = ?m+p, ?i ? ?m при
m+ p
? yk*
i ? {m, …, m + p}. Тогда при выполнении условий ? ?m и
k =m

?m + yi+ ? ?I, равновесным является любой вектор
i > m,
59
m+ p
? yk* yk ? yk+ ,
= ?m , k ? {m, …, m+p};
*
yi* = 0,
*
{y |
k =m
i ? {m, …, m + p}}. Содержательно это означает, что в равновесии
всю работу выполняют агенты, которые одинаково представляют
себе необходимый для получения вознаграждения объем работы.
Вариант III. Пусть теперь структура информированности игры
имеет глубину 2, но каждый агент считает, что играет в игру с
асимметричным общим знанием. В этом случае множество воз-
можных равновесных ситуаций становится максимально возмож-
ным: ? [0; yi ] . Более того, справедливо следующее утверждение.
+

i?N
Утверждение 8. В игре «аккордная оплата труда» для любого
вектора действий y* ? ? [0; yi+ ) существует такая структура
i?N
информированности глубины два (при которой каждый агент
субъективно играет в игру с асимметричным общим знанием), что
вектор y* является единственным равновесием.
Доказательство утверждения 8. Достаточно для каждого i ? N
? yi* , yi* > 0;
? (здесь ? – произвольное положи-
положить ? i = ?
? yi+ + ? , yi* = 0
?
тельное число) и выбрать любые ?ij > ? yi+ , j? N \ {i}. Тогда i-ый
i?N
агент ожидает от оппонентов нулевых действий, а его собственным
субъективно равновесным действием является yi* . Утверждение 8
доказано.
Замечание 1. Построенное в доказательстве утверждения 8
равновесие является (объективно) Парето-эффективным, если
сумма ? y i* равна истинному значению неопределенного пара-
i?N
метра ?.
Замечание 2. Действие yi* = yi+ является равновесным, если
?i = yi+ . Однако при этом равновесным будет и действие yi* = 0 –
в обоих случаях субъективно ожидаемый i-ым агентом выигрыш
равен нулю.
60
Вариант IV. Пусть теперь структура информированности игры
имеет глубину два, и на нижнем уровне имеется симметричное
общее знание. Иными словами, каждый фантомный агент считает:
неопределенный параметр равен ?, и это общее знание.
Оказывается, что и в этом случае множество равновесных си-
туаций является максимально возможным: ? [0; yi ] . Более того,
+

i?N
справедливо следующее утверждение.
Утверждение 9. В игре «аккордная оплата труда» для любого
вектора действий y* ? ? [0; yi+ ) существует такая структура
i?N
информированности глубины два с симметричным общим знанием
на нижнем уровне, что вектор y* является единственным равнове-
сием.
Доказательство утверждения 9. Возьмем любое значение
? > ? yi+ и будем считать, что это значение является общим зна-
i?N
нием среди фантомных агентов. Тогда единственным равновесием
в игре фантомных агентов является выбор каждым из них нулевого
действия.
Далее, для каждого i ? N положим
? yi* , yi* > 0
?
?i = ? + ,
? yi + ? , yi* = 0
?
где ? – произвольное положительное число. Тогда, как нетрудно
видеть, наилучшим ответом i-го агента на ожидаемые им нулевые
действия оппонентов является выбор действия yi* . Утверждение 9
доказано.
Замечания 1 и 2, сделанные при анализе варианта III, можно
повторить дословно и для варианта IV.
Таким образом, игра "аккордная оплата труда", помимо эф-
фектов сложной зависимости структуры информационных равно-
весий от вида структур информированности и рефлексивного
управления, интересна тем, что она иллюстрирует роль управления
нормами деятельности в случаях, когда множество равновесий
игры агентов состоит более чем из одной точки.

61
5.6. ПРИМЕР УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ:
"ДУОПОЛИЯ КУРНО"

В настоящем разделе рассматривается пример, иллюстрирую-
щий целесообразность совместного использования информацион-
ного и институционального управления. Пусть ОС состоит из двух
агентов, имеющих целевые функции
(1) fi(?, y) = (? – y1 – y2) yi – (yi)2 / 2, i = 1, 2,
множества допустимых действий составляют положительную
полуось, а ? = [1; 2].
Множества наилучших ответов агентов в рассматриваемом
примере состоят из одной точки:
(2) BR1(?1, y2) = (?1 – y2) / 3,
(3) BR2(?2, y1) = (?2 – y1) / 3.
Предположим, что субъективные представления агентов о со-
стоянии природы являются общим знанием, тогда параметрическое
равновесие Нэша есть
(4) yi* (?1, ?2) = (3 ?i – ?3-i) / 8, i = 1, 2.
Отметим, что рефлексивные отображения агентов стационар-
ны, поэтому рассмотрим четыре случая из раздела 5.4. На рисунке
4 приведены множества наилучших ответов агентов при различных
? ? ?, а также следующие множества:
0
E N – отрезок FG;
EN – четырехугольник AGCF;
E – квадрат ABCD;
E4 – шестиугольник KLMNPH.
Приведем решения обратных задач информационного управ-
ления (см. общие результаты в разделе 5.4) для вариантов I-III.
Вариант I. Множество всевозможных информационных рав-
новесий игры агентов в этом случае есть отрезок (1/4; 1/4) –
(1/2; 1/2). Множество информационных равновесий при
фиксированном ? ? [1; 2] есть точка с координатами (? / 4; ? / 4).
Поэтому согласованной является единственная норма
?i (?) = ? / 4, i = 1, 2.
1




62
y2
2




BR1(2,y2)
1 BR1(1,y2)

2/3
A B
5/8
L M
7/12
G
1/2
K
1/3
F
N
1/4
H
1/6 P BR2(2,y1)
D C
1/8
BR2(1,y1)
y1
0 1/8 1/6 1/4 1/3 1/2 7/12 5/8 2/3 1 2

Рис. 4. Множества равновесий

Решение обратной задачи следующее: реализуемыми как ин-
формационные равновесия являются одинаковые действия обоих
агентов из отрезка [1/4; 1/2]. Для того чтобы агенты выбрали век-
тор действий x1 = (?, ?) следует выбрать ? = 4 ?, ? ? [1/4; 1/2]. То
есть
(5) ? 1(?) = 4 ?.
Вариант II. Множество всевозможных информационных рав-
новесий EN игры агентов в этом случае – параллелограмм AGCF
(см. рисунок 4). Множество информационных равновесий при
фиксированном векторе (?1, ?2) ? [1; 2]2 есть точка с координата-
ми, определяемыми выражением (4). Поэтому согласованной
является единственная норма ?i2(?1, ?2) = (3 ?i – ?3-i) / 8, i = 1, 2.
Решение обратной задачи следующее: реализуемыми как ин-
формационные равновесия являются действия агентов из паралле-
лограмма AGCF. Для того чтобы агенты выбрали вектор действий

63
x2 = ( x1 , x2 ) следует выбрать ?1 = 3 x1 + x2 , ?2 = x1 +3 x2 , то
2 2 2 2 2 2

есть
(6) ? 2(x2) = {(3 x1 + x2 ; x1 +3 x2 )}.
2 2 2 2

Вариант III. Множество всевозможных информационных рав-
новесий E игры агентов в этом случае – квадрат ABCD (см. рису-
нок 4).
Рассмотрим для примера первого агента. С его субъективной
точки зрения множество информационных равновесий при фикси-
рованном векторе (?1, ?12) ? [1; 2]2 есть точка с координатами,
определяемыми выражением (4), то есть
(7) y1 (?1, ?12) = (3 ?1 – ?12) / 8, y2 (?1, ?12) = (3 ?12 – ?1) / 8.
* *

Из (7) получаем, что для того, чтобы первый агент выбрал
действие x1 ? X 10 = [1/8; 5/8] вектор (?1, ?12) должен удовлетво-
3

рять:
(8) (3 ?1 – ?12) / 8 = x1 ,
3


(9) (3 ?12 – ?1) / 8 ? BR2(?12, x1 ) = (?12 – x1 ) / 3.
3 3

Условие (9) выполнено всегда в силу определения информа-
ционного равновесия, поэтому
(10) ?1 ( x1 ) = {(?1, ?12) ? [1; 2]2 | (3 ?1 – ?12) / 8 = x1 }.
3 3 3

Аналогично, для второго агента
(11) ? 3 ( x2 ) = {(?2, ?21) ? [1; 2]2 | (3 ?2 – ?21) / 8 = x2 }.
3 3
2
Согласованной является норма ?i3(?i, ?ij) = (3 ?i – ?ij) / 8, i ? j,
i, j = 1, 2.


6. ЗАКЛЮЧЕНИЕ

Рассмотрение теоретико-игровых моделей институционально-
го управления (как воздействия на ограничения и нормы деятель-
ности участников организационных систем) свидетельствует, что,
с одной стороны, данный класс задач характеризуется высокой
вычислительной сложностью, и аналитическое решение может
быть получено лишь для ограниченного ряда частных и достаточно
простых случаев. Кроме того, во многих ситуациях мотивационное
64
управление оказывается более простым и эффективным (по срав-
нению с институциональным). С другой стороны, именно институ-
циональное управление отражает некоторые присущие именно ему
свойства и возможности управления организационными система-
ми, а максимальной эффективностью обладает совместное исполь-
зование институционального и мотивационного управлений.
Принципиально новым для теории управления организацион-
ными системами является впервые рассмотренный в настоящей
работе класс задач управления нормами деятельности, охваты-
вающий широкую область практически важных проблем управле-
ния в корпоративных структурах, управлении проектами и т.д.
Перспективным направлением исследований представляется
изучение моделей институционального и информационного управ-
ления в условиях наличия и динамики иерархии взаимных пред-
ставлений управляемых субъектов.


ЛИТЕРАТУРА

1 Автономов В.С. Модель человека в экономической науке. СПб.:
Экономическая школа, 1998.
2 Айзерман М.А., Алескеров Ф.Т. Выбор вариантов: основы
теории. М.: Наука, 1990.
3 Айзерман М.А., Вольский В.И., Литваков Б.М. Элементы тео-
рии выбора: псевдокритерии и псевдокритериальный выбор. М.:
ИПУ РАН, 1994.
4 Акоф Р., Эмери Ф. О целеустремленных системах. М.: Сов.
радио, 1974.
5 Баркалов С.А., Бурков В.Н., Новиков Д.А., Шульженко Н.А.
Модели и механизмы в управлении организационными системами.
М.: Издательство «Тульский полиграфист», 2003. Том 1. – 560 с.,
Том 2 – 380 с., Том 3 – 205 с.
6 Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в
управлении организационными системами. М.: Синтег, 2001.
7 Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: Син-
тег, 1997.


65
8 Бурков В.Н., Новиков Д.А. Теория активных систем: состояние
и перспективы. М.: Синтег, 1999.
9 Васильев Д.К., Заложнев А.Ю., Новиков Д.А., Цветков А.В.
Типовые решения в управлении проектами. М.: ИПУ РАН, 2003.
10 Вольчик В.В. Курс лекций по институциональной экономике.
Ростов-на-Дону: Изд-во РГУ, 2000.
11 Воронин А.А., Мишин С.П. Оптимальные иерархические струк-
туры. М.: ИПУ РАН, 2003.
12 Гермейер Ю.Б. Игры с непротивоположными интересами. М.:
Наука, 1976.
13 Гилев С.Е., Леонтьев С.В., Новиков Д.А. Распределенные сис-
темы принятия решений в управлении региональным развитием.
М.: ИПУ РАН, 2002.
14 Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели
принятия решений в эколого-экономических системах. М.: Радио и
связь, 1982. – 144 с.
15 Губко М.В. Механизмы управления организационными систе-
мами с коалиционным взаимодействием участников. М.: ИПУ
РАН, 2003.
16 Губко М.В., Новиков Д.А. Теория игр в управлении организа-
ционными системами. М.: Синтег, 2002.
17 Караваев А.П. Модели и методы управления составом активных
систем. М.: ИПУ РАН, 2003.
18 Коргин Н.А. Неманипулируемые механизмы обмена в активных
системах. М.: ИПУ РАН, 2003.
19 Менар К. Экономика организаций. М.: ИНФРА-М, 1996.
20 Мескон М., Альберт М., Хедоури Ф. Основы менеджмента. М.:
Дело, 1998.
21 Мильнер Б.З. Теория организации. М.: ИНФРА-М, 2002.
22 Миркин Б.Г. Проблема группового выбора. М.: Наука, 1974.
23 Молодцов Д.А. Устойчивость принципов оптимальности. М.:
Наука, 1987.
24 Мулен Э. Кооперативное принятие решений: аксиомы и модели.
М.: Мир, 1991.
25 Новиков Д.А. Динамика поведения систем с большим числом
целенаправленных элементов // Автоматика и Телемеханика. 1996.
№ 4. С. 187 – 189.

66
26 Новиков Д.А. Закономерности итеративного научения. М.: ИПК
РАН, 1998. – 96 с.
27 Новиков Д.А. Механизмы функционирования многоуровневых
организационных систем. М.: Фонд «Проблемы управления», 1999.
28 Новиков Д.А. Обобщенные решения задач стимулирования в
активных системах. М.: ИПУ РАН, 1998.
29 Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.:
Синтег, 1999.
30 Новиков Д.А. Сетевые структуры и организационные системы.
М.: ИПУ РАН, 2003.
31 Новиков Д.А., Смирнов И.М., Шохина Т.Е. Механизмы управ-
ления динамическими активными системами. М.: ИПУ РАН, 2002.
32 Новиков Д.А. Стимулирование в организационных системах.
М.: Синтег, 2003.
33 Новиков Д.А. Стимулирование в социально-экономических
системах (базовые математические модели). М.: ИПУ РАН, 1998.
34 Новиков Д.А., Цветков А.В. Механизмы стимулирования в
многоэлементных организационных системах. М.: Апостроф, 2000.
35 Новиков Д.А., Цветков А.В. Механизмы функционирования
организационных систем с распределенным контролем. М.: ИПУ
РАН, 2001.
36 Новиков Д.А., Чхартишвили А.Г. Активный прогноз. М.: ИПУ
РАН, 2002.
37 Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.:
Синтег, 2003.
38 Норт Д. Институты, институциональные изменения и функцио-
нирование экономики. М.: "Начала", 1997.
39 Олейник А.Н. Институциональная экономика. М.: ИНФРА-М,
2000.
40 Петраков С.Н. Механизмы планирования в активных системах:
неманипулируемость и множества диктаторства. М.: ИПУ РАН,
2001.
41 Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
42 Саймон Г. Науки об искусственном. М.: Мир, 1972.
43 Словарь иностранных слов. М.: Русский язык, 1982.
44 Трауни Э. Экономическое поведение и институты. М.: Дело,
2001.

67
45 Фишберн П. Теория полезности для принятия решений. М.:
Наука, 1978.
46 Щепкин А.В. Механизмы внутрифирменного управления. М.:
ИПУ РАН, 2001. – 80 с.
47 Aleskerov F., Monjardet B. Utility maximization, choice and prefer-
ence. Berlin: Springer, 2002.
48 Fudenberg D., Tirole J. Game theory. Cambridge: MIT Press, 1995.
49 Mas-Colell A., Whinston M.D., Green J.R. Microeconomic theory.
N.Y.: Oxford Univ. Press, 1995.
50 Myerson R.B. Game theory: analysis of conflict. London: Harvard
Univ. Press, 1991.
51 Simon H. Administrative behavior. N.Y.: Frece Press, 1976.




68

<<

стр. 2
(всего 2)

СОДЕРЖАНИЕ