<<

стр. 2
(всего 2)

СОДЕРЖАНИЕ

[0, z * х(в)
114
где х(в) е A0 - параметр (план), результат деятельности х(в) е A0 реализуется с минимальными затратами центра на стимулирование (см. теорему 4.6.1).
Возможно использование более простых, чем (5) конструкций, учитывающих специфику рассматриваемой модели. Например, система стимулирования
* 1 max с, (у) + 5,, z = z(у, в)
(6) s, (х(в), z) = \ yeY(z•в) , i е I,
[0, z * z(у, в )
где х(в) е A0 - параметр (план), реализует результат деятельности х(в) е A0 как равновесие Нэша47 (естественно, система стимулирования (6) имеет не более высокую эффективность, чем оптимальная система стимулирования (5)). Очевидно, что эффективности совпадают в случае, когда по наблюдаемому результату деятельности и состоянию природы центр в состоянии восстановить действия АЭ, то есть, например, когда выполнено: "i е I " y/, у2 е A', У/ ^ У2, "в е О Zl(y/, в) ^ zi(y2, в) и " i е I "у е A', " в2 е О, в/ ^ в2, Zi(y, в/) ^Zi(y, в2).
Наиболее выгодный для центра результат деятельности АС х (в) е A0, который может рассматриваться как гибкий (зависящий от состояния природы - см. выше) план, определяется как решение задачи оптимального согласованного планирования:
х*(в) = aгg max [H(z) - J(z, в)].
zeA0
Таким образом, второй вариант может рассматриваться как частный случай модели S6. Аналогичным образом можно показать, что третий вариант совпадает с моделью, описанной в разделе 4.7.
Итак, для рассматриваемой модели в условиях полной информированности решение задачи стимулирование дается теоремами 4.2.1, 4.3.1, 4.4.1, 4.5.1, 4.6.1. Отметим, что системы стимулирования (5) и (6) реализуют соответствующие вектора действий АЭ как равновесия Нэша. Гораздо сложнее обстоит дело с реализацией определенных действий АЭ как равновесий в доминантных стратегиях. Для этого (опять же в соответствии с теоремами, приведенными в четвертом разделе) необходимо, чтобы центр мог компенсировать каждому АЭ затраты независимо от обстановки игры при условии, что данный АЭ выбрал требуемое действие. Для этого, как минимум, необходимо, чтобы центр был в состоянии наблюдать или однозначно восстанавливать действие каждого АЭ. В рассматриваемой (детерминированной!) модели это возможно далеко не всегда (в общем случае - невозможно). Тем более затруднительна идентификация индивидуальных действий в условиях, когда присутствует неопределенность относительно состояния природы48. Поясним последнее утверждение.
Единственным достаточно подробно исследованным классом задач стимулирования в многоэлементных АС с неопределенностью являются задачи теории контрактов [63, 65], то есть задачи с внешней вероятностной неопределенностью и симметричной информированностью (см. классификацию в [44] и обзоры [9, 34]). Для этого класса задач в рамках обобщения двушагового метода [58-60] для конечных допустимых множеств задача стимулирования сводится к набору задач выпуклого программирования, обладающих чрезвычайно высокой вычислительной сложностью.
Таким образом, общих подходов к аналитическому49 решению многоэлементной задачи стимулирования в условиях неопределенности, описанной выше, на сегодняшний день, к сожалению, не существует. Следовательно, необходимо упрощать модель, стре- мясь получать конструктивные и содержательно интерпретируемые теоретические результаты, которые могли бы в дальнейшем найти применение на практике.
Поэтому упростим модель, введя предположение о том, что результат деятельности каждого АЭ зависит только от его собственного действия и соответствующей компоненты состояния природы, то есть будем считать50, что Zi = z.iy*, в,), i е I.
В этом случае возможно комбинированное применение идеи декомпозиции игры АЭ и результатов исследования моделей стимулирования в одноэлементных АС, функционирующих в условиях неопределенности. Проиллюстрирует это утверждение, рассмотрев ряд моделей многоэлементных АС с интервальной, вероятностной и нечеткой внешней неопределенностью при симметричной информированности участников.
7.2.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ
Предположим, что всем участникам АС на момент принятия решений известны множества {О,} возможных значений неопределенного параметра, а также "технологические" зависимости {z.i', )}. Пусть: затраты АЭ несепарабельны и зависят от действий АЭ, а центр использует стимулирование каждого АЭ, зависящее от результатов деятельности всех АЭ. Тогда целевые функции центра и АЭ имеют, соответственно, вид:
(1) Fiz, у) = Н(у) - X s i (z),
leI
(2) f(z, у) = s(z) - сгСу).
Фиксируем некоторое значение параметра в е О и запишем определение равновесия Нэша:
(3) E^ia, в) = {у" е A' | " i е I, "у, е A,
s(Zi( yN, в), z-i( у -г, в-1))-с1(у") > siiziiy,, вг), z-i( y-i, в-1))-с1(у1, y-i)}.
Предположим, что и центр, и АЭ при устранении неопределенности используют принцип МГР. Однако одного этого предположения оказывается недостаточно для корректного определения равновесия Нэша в рамках рассматриваемой модели. Действительно, в выражении (3) можно брать min fi(y, в) или решать систему
вleQl
неравенств (для i е I) и т.д.
Другими словами, поиск решения игры в условиях неопределенности сталкивается с множеством как методологических, так и "технических", трудностей, происхождение которых качественно можно объяснить тем, что, фиксируя s е M и записывая определение множества решений игры при данной системе стимулирования, мы обрекаем себя на поиск системы стимулирования, оптимальной в соответствующем подмножестве M функционального пространства, что само по себе является нетривиальной задачей.
Вспомним, что помимо метода анализа множеств реализуемых действий для решения задачи стимулирования может использоваться не менее эффективный метод анализа минимальных затрат на стимулирование [44], который заключается в том, что для каждого вектора действий АЭ ищется минимальная система стимулирования, его реализующая, а затем на этапе согласованного планирования определяется оптимальный вектор реализуемых действий. То есть при использовании метода анализа минимальных затрат на стимулирование оптимизация производится в более простом пространстве (Wn), чем пространство кусочно-непрерывных положи- тельнозначных функций, которое приходится использовать при применении метода множеств реализуемых действий.
Введем следующее предположение.
А.7.2. z.i , ) - непрерывные однозначные строго монотонные функции своих переменных, i е I.
Обозначим Z.iy*, О,) = {z,- е A0i | z* = z.ty*, в.), в* е О*} - множество тех результатов деятельности i-го АЭ, которые могут реализоваться при выборе им действия у* е A* и всевозможных состояниях природы.
118
Теорема 7.2.1. Если выполнено предположение А.7.2, то система стимулирования
(4) s,^: Zi) = |с1<У*, y-i < i е I,
[G, Zi" Z, (у,, Wi)
реализует (как равновесие Нэша) вектор действий у* е A', который оптимален при условии
(5) у* е Aгg max {Н(у) - X с, (у)}.
yeA' leI
Доказательство. Фиксируем произвольный вектор у е A' действий АЭ и запишем условия его гарантированной реализуемости как равновесия Нэша системой стимулирования { si}:
(6) "в е О, "ге I, " уг е A, а.Су*, z-iу*, в,), Z-i(у-,., в-,)) - с.Су*) >
* *
> sty , Zi^i, вг), Z-i( У-1 , в-i)) - сгСуг, у-, )}. Из условий индивидуальной рациональности АЭ (напомним, что условие индивидуальной рациональности АЭ гласит, что в равновесии значение его целевой функции должно быть неотрицательно) следует, что должно быть выполнено:
(7) "в е О, "ге I si(y*, z-iу*, в), z_i(у-,., в-,)) > сСу*), то есть левая часть неравенств (6) неотрицательна.
Так как системы неравенств (6) и (7) должны иметь место при любом значении неопределенного параметра, то, если использовать систему стимулирования {s.iz)} (в которой вознаграждение каждого АЭ зависит от результатов деятельности всех АЭ), то придется брать минимум в левых частях выражений (6) и (7) по всему множеству О. Поэтому лучше (с точки зрения гарантированной эффективности стимулирования) использовать систему индивидуального стимулирования {siz,)}. При ее использовании условие (7) примет вид:
(5) " ге I, "вг е Ог siiy*, Zi(у*, вг)) >с.Су*).
Система стимулирования (4) удовлетворяет ограничениям (8) как равенствам. Докажем, что при ее использовании у - точка Нэша.
Из предположения А.7.2 следует, что " i е I " y/ ^у2 е Ai симметрическая разность множеств Zi(y/, О.) и Zi(y2, О,) непуста:
119
Zi(y/, О,) D Zi(y2, О,) ^ 0, то есть при использовании центром сис-
*
темы стимулирования (4) и выборе i-ым АЭ действия у* ^ у^ всегда найдется такое состояние природы в* е О*, при котором вознаграждение АЭ будет равно нулю. Следовательно, система стимулирования (4) гарантированно реализует вектор у* е A' как равновесие Нэша51.
Выражение (5) означает, что центр побуждает АЭ выбрать наиболее выгодное для себя (то есть максимизирующее разность между доходом и затратами на стимулирование) гарантированно реализуемое действие. •
Исследуем роль неопределенности. Сравнивая выражения (4) и (1) (из раздела 4.2), замечаем, что затраты центра на стимулирование одинаковы в детерминированной модели и в рассматриваемой модели АС с внешней интервальной неопределенностью. Содержательно это можно объяснить симметричной информированностью центра и АЭ и "осторожностью" АЭ (использованием ими МГР)52. Например, если бы сепарабельные затраты i-го АЭ зависели от результата его деятельности, то центр был бы вынужден компенсировать ему max с^ (z^) .
Zi-eZi (y*,Qi)
В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.1 переходит в теорему 4.2.1.
7.2.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ
Пусть затраты всех АЭ несепарабельны и зависят от результатов деятельности, то есть с* = ci(z), i е I. Предположим, что на момент принятия решений участники АС обладают одинаковой информацией о распределениях вероятностей {pi(zi, у,)} результатов деятельности АЭ в зависимости от его действия, и "технологических" зависимостях {z*,-, )}.
К сожалению, на сегодняшний день даже для одноэлементных АС, функционирующих в условиях внешней вероятностной неопределенности, не получены общие аналитические решения задач стимулирования второго рода. Поэтому в настоящем разделе мы рассмотрим модель, для которой решения одноэлементных задач известны, проиллюстрировав эффективность использования идеи декомпозиции игры АЭ в многоэлементной вероятностной АС.
Предположим, что распределения вероятностей (интегральные функции распределения) имеют следующий вид (так называемая модель простого АЭ):
( ч (Zi )• Zi < у, . ,
(1) F, (zi ^ у,) = ^ , 1 е I.
[ 53• zi ^ У,
Для одноэлементной модели простого АЭ доказана оптимальность компенсаторных систем стимулирования [16, 44].
Теорема 7.2.2. В рамках ГБ система стимулирования
**
(2) si(v*, Zi) = ]с1 (Zl ^Z-l )• Zl ? У:, i е I,
[ 0• z, > у,
реализует (как равновесие Нэша) вектор действий у е A', который оптимален при условии1
(3) у* е Aгg max {Н(у) - E X с,- (z) }.
1 /)'
yeA' leI
Доказательство. В работах [16, 44] доказано, что в модели простого АЭ стационарные точки полезности АЭ и его ожидаемой полезности совпадают. По аналогии можно показать, что в многоэлементной АС при фиксированной обстановке игры совпадают стационарные (по стратегии данного АЭ) точки полезности АЭ и его ожидаемой полезности.
В соответствии с результатом теоремы 4.2.1 при использова-
, - ^ . * * нии центром системы стимулирования (2) вектор z е Ao, z = у ,
является "равновесием Нэша", то есть доставляет максимум целевой функции АЭ при фиксированных результатах деятельности остальных АЭ. Следовательно, при фиксированной обстановке игры он доставляет максимум и ожидаемой полезности АЭ, то есть у* - равновесие Нэша. При этом компенсаторная система стимулирования (2) является минимальной, то есть характеризуется минимальными затратами центра на стимулирование.
Ожидаемые затраты центра на стимулирование равны:
*
(4) EXс,.(Z) = X I {{с,(z,,z-i)pi(z,)dz, +
ieI ieI Ag_. 0
[1 - Fi(y*)] сг(у*)} p-i(z-i, y-i) dz.i.
Подставляя (4) в целевую функцию центра, получаем условие оптимальности (3). •
В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.1 переходит в теорему 4.2.1, а
выражение (4) в X с* (у ) .
ieI
7.2.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ
Рассмотрим следующую модель многоэлементной АС с нечеткой внешней неопределенностью и симметричной информированностью участников. Пусть: вектор результатов деятельности АЭ z принадлежит компакту A0 в Шзатраты АЭ зависят от результатов деятельности и несепарабельны, а функция дохода центра зависит от действий АЭ.
Информированность участников АС следующая: на момент принятия решений и центр, и АЭ имеют нечеткую информацию о состоянии природы и "технологических" зависимостях {z.i,-)}. В соответствии с принципом обобщения [35] этого достаточно, чтобы определить нечеткую информационную функцию P (z, у), P : A0 X A' (r) [0; 1], ставящей в соответствие вектору действий АЭ нечеткое подмножество множества результатов деятельности.
122
Обозначим
(1) Q(z) = {у е A' I P(z, у) = 1}.
(2) Z(y) = {z е Ao I P(z, y) = 1}.
Введем следующие предположения.
А.7.3. Нечеткие функции P (z, у) 1-нормальны [35, 41, 44], то есть "у е A' $ z е A0: P (z, у) = 1 и " z е A0 $ у е A': P (z, у) = 1.
Если выполнено предположение А.7.3, то " у е A' " z е A0 Q(z) ^ 0, Z(y) ^ 0.
Более сильным, чем А.7.3 является следующее предположение:
А.7.4. А.7.3 и UQ(z) = A', UZ(у) = A0.
zeAg yeA'
А.7.5. Целевые функции АЭ и нечеткая информационная функция P (z, у) полунепрерывны сверху54.
Обозначим EN^ (s) - множество равновесных по Нэшу результатов деятельности АЭ:
(3) EN (s) = {zN е A01 "ге I, "z, е A0i
s(zN) - Cг(zN) > siiZi, Z-i ) - Cг(Zг, Z)}.
Обозначим EN(a) - множество равновесных по Нэшу при использовании центром системы стимулирования s векторов действий АЭ.
Лемма 7.2.1. Если выполнены предположения А.7.3-А.7.5, то
(4) EnCs) = z).
zeEN (s)
Доказательство. Фиксируем i е I. Целевая функция i-го АЭ и нечеткая информационная функция P (z, у) индуцируют на множестве A' нечеткое отношение предпочтения (НОП) i-го АЭ. В теории принятия решений при нечеткой исходной информации рациональным считается выбор АЭ максимально недоминируемых по его НОП альтернатив (действий).
Определение индуцированного НОП и максимально недоминируемых альтернатив для задач стимулирования приведено в работах [35, 41, 44]. Однако, непосредственное использование максимально недоминируемых альтернатив в задачах стимулирования затруднительно в силу громоздкости их определения. В одноэлементных АС с нечеткой внешней неопределенностью на основании подхода, предложенного С.А. Орловским, использовался следующий метод решения задач стимулирования: формулировалась задача четкого математического программирования (ЧМП) и доказывалось, что максимально недоминируемыми альтернативами являются решения этой задачи и только они. Поступим аналогичным образом и в рассматриваемой многоэлементной модели.
Для фиксированной обстановки игры можно, по аналогии с результатами, приведенными в [42, 44], доказать, что в рамках предположений А.7.4 и А.7.5 четко недоминируемыми альтернативами являются те и только те действия АЭ, функция принадлежности нечеткого результат деятельности от которых равна единице в точке максимума целевой функции АЭ. Следовательно, если некоторый результат деятельности Zi i-го АЭ принадлежит при обстановке множеству (s) (см. выражение (3)), то множество
четко недоминируемых действий этого АЭ есть Q(z). Вычисляя объединение по всем точкам Нэша, в силу предположения А.7.4, получаем выражение (4). •
Теорема 7.2.3. Если выполнены предположения А.7.4-А.7.5, то система стимулирования
(5) ^(z: Zi) = I с1(Z*, Z-i) + ^ i, Zi = Z*, i е X
I0, z, ^ z*
где
(6) z* = aгg max { min Н(у) - X с^ (z) },
zeAo yeQ(z) ieI
гарантированно ^-оптимальна.
Доказательство. В силу теоремы 4.4.1 система стимулирования
(5) при S* > 0, i е I, обеспечивает максимизацию целевой функции
*
каждого АЭ при (единственном!) результате деятельности z* при любой обстановке игры (и минимальных затратах центра на стиму- 124 лирование). Из леммы 7.2.1 следует, что множество равновесий Нэша при этом есть Q(z ). Предположение А.7.5 гарантирует, что изменением z* е A0 любой допустимый вектор действий АЭ может быть сделан точкой Нэша.
При определении гарантированной эффективности системы стимулирования (5) следует вычислить гарантированный доход центра: min Н(у), то есть взять минимум функции дохода центра
yeQi z)
по множеству равновесий Нэша. Оптимальной окажется (результат решения задачи оптимального согласованного планирования) система стимулирования, максимизирующая целевую функцию центра - см. выражение (6). •
Исследуем влияние неопределенности. Сравнивая выражение
(6) с эффективностью max {Н(у) - X с* (у) } стимулирования в
yeA leI
детерминированном случае (см. раздел 4.4), можно сделать вывод, что гарантированная эффективность стимулирования в АС с нечеткой внешней неопределенностью не выше, чем соответствующих
детерминированных АС (например, за счет вычисления min Н(у)
yeQi Z)
- см. выражение (6)). Очевидно, что с ростом нечеткой неопределенности (в смысле, определенном в [44]) множество Q(z), по которому вычисляется минимум, не сужается, следовательно, не возрастает и гарантированная эффективность стимулирования.
В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.3 переходит в теорему 4.4.1. В том числе, например, когда в рамках предположений А.7.3-А.7.5 нечеткие информационные функции сепарабельны и однопиковые с точками максимума в действиях АЭ, множества равновесий Нэша и эффективности в четком и нечетком случаях, очевидно, совпадают.
В заключение настоящей главы отметим, что перспективными представляются следующие направления исследований многоэлементных АС с неопределенностью. Во-первых, это класс АС, в которых результат деятельности каждого АЭ зависит от действий всех АЭ. Во-вторых, исследование условий на информированность игроков (например, свойства плотности совместного распределе-
125
ния состояний природы), при которых можно без потери эффективности использовать индивидуальные системы стимулирования и т.д. В третьих, представляет интерес рассмотрение механизмов с платой за информацию в многоэлементных АС с неопределенностью и асимметричной информированностью.
В целом, из проведенного в настоящей главе анализа многоэлементных АС с неопределенностью можно сделать вывод, что в тех случаях, когда соответствующие одноэлементные модели исследованы достаточно полно, и для них получены аналитические решения, то идея декомпозиции игры АЭ в многоэлементной АС позволяет достаточно просто получить оптимальное решение задачи стимулирования. В случае, когда соответствующие одноэлементные модели исследованы недостаточно подробно (когда, например, для них не получены даже достаточные условия оптимальности простых систем стимулирования), существенно продвинуться в изучении их многоэлементных расширений не удается.
8. МОДЕЛИ СТИМУЛИРОВАНИЯ С ГЛОБАЛЬНЫМИ ОГРАНИЧЕНИЯМИ НА МНОЖЕСТВА ДОПУСТИМЫХ ДЕЙСТВИЙ АЭ
Рассмотрим АС, состоящую из n АЭ с целевыми функциями yi(v), i е I, у = (y/, у2, у"). Предположим, что, помимо индивидуальных ограничений на множества допустимых стратегий: у* е A*, ieI• существуют глобальные ограничения A;^ на выбор состояний
n
АЭ, то есть у е A' п A^^, где A' = ^ A* .
i=1
Можно выделить несколько методов учета глобальных ограничений, то есть методов сведения теоретико-игровых моделей с глобальными ограничениями на множества допустимых стратегий игроков к моделям, для которых имеет место гипотеза независимого поведения.
"Метод штрафов". Данный метод заключается в том, что в случае, когда вектор действий АЭ оказывается вне множества A;^ (то есть у ^ Aгл)• целевые функции игроков считаются равными
126
минус бесконечности - игроки штрафуются за нарушение ограничений [15, 24, 66]. Далее можно рассматривать игру с "новыми" целевыми функциями, в которой отсутствуют глобальные ограничения. В зависимости от информированности игроков и того, кто из игроков нарушает глобальные ограничения, строятся гарантирующие стратегии [24].
"Метод расширения стратегий". В исходной игре все АЭ выбирают свои стратегии одновременно и независимо, не обмениваясь информацией с другими игроками55. Можно рассмотреть игру, в которой каждый из игроков делает предположения о выборе других игроков или реакции других игроков на выбор им той или иной стратегии. В подобных играх используют концепцию П-решения [15] (см. также Байесовское равновесие, равновесие Штакельберга и др. [56, 66]), которая включает в себя максиминные равновесия, равновесия Нэша и ряд других как частные случаи, и заключается в следующем.
Пусть все активные элементы, за исключением i-го, выбрали свои стратегии у-г е A-i. Введем множества: Ai(y-i) = {у,- е A* | у е A' п A;^}, i е I, Ai(y-i) - множество стратегий i-го АЭ, при которых вектор действий удовлетворяет глобальным ограничениям56. Предположим, что i-ый АЭ делает предположение Пг(уг) с A-i о множестве возможных "реакций" остальных АЭ на выбор им стратегии yieAi, i е I. Тогда, например, рациональным можно считать поведение игроков, заключающееся в стремлении к максимизации выбором собственной стратегии из множества I Ai(y-i)
y-i-eni (уг)
гарантированного по множеству Пг(уг) значения своей целевой функции, то есть
у" = aгg max min /г(у), i е I.
Уг e П A,(y-i) y-i en,(у,)
y-i en,-(vi)
Возможны и другие определения рациональности поведения
игроков, например: введем множества 7-- (у,) = Aгg min fi(y),
y-ieni (Уг)
A?,. = П Ai(y-i), у," = aгg max min f-ty), i е I, и т.д.
y-ieY-i (y,) yi^Ai y-i eni(yi)
Если предположения всех АЭ оправдываются, то есть " i е I y-,. е Пг( уН), то ситуацию игры уП е A' п называют П- равновесием.
Существует несколько частных случаев, в которых учет глобальных ограничений производится "автоматически". Если у каждого из игроков имеется доминантная стратегия (или в игре существует единственное равновесие Нэша) и игра характеризуется полной информированностью, то каждый из игроков может вычислить доминантные стратегии всех остальных игроков (соответственно - точку Нэша). Если при этом вектор доминантных стратегий (или точка Нэша) удовлетворяют глобальным ограничениям, то проблем их учета не возникает.
Отметим, что метод расширения стратегий, во-первых, требует от исследователя операций введения трудно обосновываемых предположений о принципах поведения игроков, а, во-вторых, не всегда П-решение оказывается П-равновесием, или, вообще, существует.
Если в методе штрафов и в методе расширения стратегий никак не оговаривалось наличие управления со стороны центра, то следующие два метода учета глобальных ограничений существенно используют управляющие возможности центра.
"Метод согласования". Основная идея метода согласования заключается в следующем (см. также двухшаговый метод решения вероятностных [58] и др. задач стимулирования и метод согласованного планирования [15]). На первом шаге решения задачи управления (стимулирования) центр для каждого вектора действий, принадлежащего множеству A' (без учета глобальных ограничений) ищет допустимое управление, при котором данный вектор действий принадлежит множеству решений игры активных элементов. Результатом первого шага, например, в задаче стимулирования, является множество AM действий АЭ, реализуемых при данных ограничениях M на систему стимулирования, AM с A'.
128
Затем на втором шаге центр ищет множество A действий АЭ, которые, во-первых, реализуемы, во-вторых, удовлетворяют заданным глобальным ограничениям A;^, и на которых достигается максимум его целевой функции. Итак, на втором шаге центр решает следующую задачу: (1) A* = Aгg max Ф(у).
уе AM гл
Максимальная эффективность управления при этом равна Ф(у*), где у* - произвольный элемент множества A*.
"Метод изменения порядка функционирования". Выше предполагалось, что АЭ выбирают, при известной стратегии центра, свои действия одновременно и независимо. Если центр как метаиг- рок может изменить порядок функционирования, то есть последовательность получения информации и выбора стратегий активными элементами, то, варьируя последовательность выбора стратегий АЭ, можно существенно упростить задачу учета глобальных ограничений. Если существует нумерация АЭ, такая что A* = Ai(y/, у2, ..., yi-/)• то каждый АЭ должен при выборе своей стратегии учитывать ограничения, наложенные совместно глобальным ограничением и уже выбранными к настоящему моменту стратегиями АЭ с меньшими номерами.
Например, допустимой с рассматриваемой точки зрения является последовательность функционирования АС, имеющая вид сетевого графика (без контуров). Частным случаем является последовательный выбор стратегий активными элементами - так называемые производственные цепочки (см. также раздел 9) [15, 26].
Еще раз подчеркнем, что возможность использования метода изменения порядка функционирования должна быть предусмотрена "правилами игры", то есть, учтена в модели активной системы.
Закончив перечисление методов учета глобальных ограничений, перейдем к систематическому описанию различных вариантов взаимозависимости и взаимосвязи игроков в многоэлементных АС.
В работе [15] активными системами с зависимыми АЭ были названы системы, в которых либо существуют глобальные ограничения на множество возможных действий, либо/и целевая функция каждого АЭ зависит от, помимо его собственных действий, действий других АЭ. Для того чтобы различать эти два случая, мы будем
129
придерживаться следующей терминологии: если АЭ производят свой выбор независимо (отсутствуют глобальные ограничения на вектор действий АЭ), и целевая функция каждого АЭ зависит только от его собственной стратегии, и отсутствуют общие ограничения на управляющие переменные (допустимые функции стимулирования и т.д.), то такую АС будем называть АС с независимыми и несвязанными АЭ57. Если добавляются общие ограничения на управления, то такие АС будем называть АС со слабо связанными АЭ (АЭ оказываются связаны косвенно - через ограничения на стратегии центра) [16, 20, 42, 44]. Если добавляется зависимость целевой функции АЭ от обстановки игры, то такую АС будем называть АС с сильно связанными (но независимыми!) АЭ. Если добавляются только общие ограничения на множество стратегий АЭ системы, то такую АС будем называть АС с зависимыми АЭ (см. таблицу 2 ниже).
Выше в настоящей работе исследовались задачи стимулирования в АС с сильно связанными и независимыми АЭ. Таким образом, остается открытым вопрос о методах решения задачи стимулировании в АС с зависимыми АЭ (несвязанными, сильно и слабо связанными). Так как АС с сильно связанными АЭ включают в себя АС с несвязанными и слабо связанными АЭ как частный случай, перейдем к рассмотрению задач стимулирования в АС с сильно связанными и зависимыми АЭ.
Метод штрафов в задачах стимулирования в многоэлементных АС имеет следующий вид. В общем случае считаем, что затраты АЭ несепарабельны и приравниваем их минус бесконечности при недопустимых (с точки зрения глобальных ограничений) действиях АЭ, после чего применяем технику анализа, описанную в четвертом разделе настоящей работы.
Метод согласования может использоваться в приведенном выше виде без каких-либо изменений.
Напомним, что при решении задач стимулирования в многоэлементных АС выше (в четвертом разделе) реализуемый опти-
мальной квазикомпенсаторной системой стимулирования вектор действий АЭ входил в эту систему стимулирования как параметр. Поэтому, в более общем случае, охватывающем и метод штрафов, и метод согласования, можно считать, что на АЭ (или центр, что то же самое в силу оптимальности компенсаторных систем стимулирования) наложены штрафы следующего вида:
Zi(y) =
'i?,- (у )• у ^ Aгл ,0, у е Aгл'
где (у) - некоторые неотрицательные функции, i е I. Тогда,
если AM - множество реализуемых действий, определяемых без учета глобальных ограничений на действия АЭ, то целевая функция центра в задаче стимулирования второго рода (с учетом глобальных ограничений) имеет вид:
(2) Ф(у) = Н(у) - X{Cl (у) + Ci (У)}.
i=1
Задача планирования запишется в виде:
n
(3) X* = aгg max [Н(у) - X {с,- (у) + С, (У)}],
xeAM i=1
а максимальная эффективность стимулирования (эффективность оптимальной системы стимулирования) равна K* = Fix*)58.
В таблице 2 представлены возможные комбинации глобальных ограничений ("+" - наличие глобальных ограничений, "-" - отсутствие глобальных ограничений) на множества допустимых стратегий АЭ, их целевые функции и управления.


Множества допустимых стратегий АЭ
Целевые функции АЭ
Управления (допустимые стратегии центра)
Тип АС
1.
-
-
-
АС с независимыми и несвязанными АЭ
2.
+
-
-
АС с зависимыми и несвязанными АЭ
3.
+
+
-
АС с зависимыми и сильно связанными АЭ
4.
+
-
+
АС с зависимыми и слабо связанными АЭ
5.
-
+
-
АС с независимыми и сильно связанными АЭ
6.
-
-
+
АС с независимыми и слабо связанными АЭ
7.
-
+
+
АС с независимыми и сильно связанными АЭ
8.
+
+
+
АС с зависимыми и сильно связанными АЭ
Таблица 2. Классификация взаимосвязанности и взаимозависимости АЭ.

Рассмотрим кратко все восемь случаев (см. таблицу 2) и покажем для них, что при решении задач стимулирования в многоэлементных АС с зависимыми АЭ учет глобальных ограничений на множества допустимых действий АЭ возможно осуществлять, применяя как метод штрафов, так и метод согласования, причем их использование не изменяет результатов, описанных в четвертом разделе настоящей работы.
Качественное обоснование справедливости последнего утверждения таково - взаимосвязь АЭ (в смысле целевых функций) была учтена при решении задач стимулирования в четвертом разделе настоящей работы, а, используя выражения (2) и (3), удается декомпозировать и учесть "независимо" факторы, связанные с ограничениями на множества допустимых стратегий АЭ и центра.
132
Другими словами, в общем случае алгоритм действий при учете глобальных ограничений таков: для каждой из моделей S1-S8 на втором этапе решения задачи стимулирования (этапе поиска оптимального для центра реализуемого действия) максимизация целевой функции центра ведется не по всему множеству A' допустимых действий АЭ, а по множеству: A' п A,^ п AM. При этом "автоматически" обеспечивается учет глобальных ограничений как на действия АЭ, так и на стимулирование.
Случай 1. АС с независимыми и несвязанными АЭ. Очевидно, что многоэлементная АС с независимыми и несвязанными АЭ может быть представлена в виде набора невзаимодействующих одноэлементных активных систем (ни согласование с глобальными ограничениями, ни штрафы в данном случае не требуются). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется независимо по множествам Ai, i е I.
Случай 2. АС с зависимыми59 и несвязанными АЭ. В данном случае центр имеет возможность использовать индивидуальное стимулирование для каждого АЭ, рассматривая в качестве реализуемых только вектора действий, принадлежащие множеству допустимых с точки зрения глобальных ограничений (метод согласования), то есть на втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A'пЛгл.
Случай 3. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A'пЛгл.
Случай 4. АС с зависимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A' п A,^ п AM.
Случай 5. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A'.
Случай 6. АС с независимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A' п AM. Как отмечалось выше, задача управления АС с независимыми и слабо связанными АЭ может быть сведена к параметрической задаче управления набором одноэлементных АС и задаче выбора оптимального значения параметра.
Случай 7. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A' п AM.
Случай 8. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A'п AM п A^^.
Таким образом, учет глобальных ограничений на стратегии участников АС (активных элементов и центра) производится методами штрафов или согласования в рамках предложенной в четвертом разделе методики решения задач стимулирования в многоэлементных АС.
До сих пор при рассмотрении задач стимулирования мы предполагали, что единственным управляющим воздействием на АЭ со стороны центра является изменение системы стимулирования. В то же время, одним из параметров модели АС (и, как показал проведенный выше анализ - параметров, существенно влияющих на эффективность стимулирования) являются множества допустимых действий АЭ. Поэтому исследуем задачу управления АС, в которой
134
центр, помимо выбора системы стимулирования, имеет возможность влиять и на множества допустимых действий АЭ60.
Рассмотрим многоэлементную АС, отличающуюся от исследуемой в четвертом разделе настоящей работы следующим. Пусть центр имеет возможность выбирать, помимо функций стимулирования, управляющие параметры и* е U*, i е I, определяющие множества допустимых действий АЭ, то есть A* = Ai(u). Тогда вектор действий активных элементов у принадлежит допустимому множен n
ству A(u) = ^ A* (и,.), и = (u/, и2, и") е U' = ^ U^ . i=1 i=1
Предположим, что Vу е A' $ и е U': у е A(U). Содержательно данное предположение означает, что множество допустимых управлений центра достаточно "велико" для того, чтобы сделать допустимым любой вектор действий АЭ.
Назначая определенные значения управляющих параметров ueU'• центр несет издержки с(и), С- U' (r) Ш1, измеряемые в денежном выражении. Тогда целевая функция центра имеет вид (в общем случае будем считать, что затраты АЭ несепарабельны, а индивидуальное стимулирование каждого АЭ зависит от действий всех АЭ):
(4) Ф(у, о, и) = Н(у) - X s, (у) - С(и).
i=1
Действия у*, выбираемые АЭ, являются равновесием Нэша при данных управлениях, то есть у е E^io, и). Задача управления в рамках гипотезы благожелательности заключается выборе управляющих параметров, максимизирующих целевую функцию центра на множестве решений игры:
(5) max Ф(у, о, и) (r) max .
yeEN(о,и) оеМ, ueU'
Для решения задачи (5) воспользуемся комбинацией результатов, полученных в четвертом разделе, и выражениями (1)-(3),
позволяющими учитывать глобальные ограничения.
Фиксируем произвольный вектор действий АЭ x е A'. Для того чтобы этот вектор действий был реализуем, необходимо и достаточно, чтобы он был равновесием Нэша (для этого достаточно использовать соответствующую компенсаторную систему стимулирования - см. раздел 4), и был допустимым действием (с точки зрения ограничений на множества действий АЭ). Для удовлетворения последнему условию центр должен выбрать такие значения управляющего параметра и е U', чтобы V -е I x* е A.iu*).
Обозначим U.ix,) = {и* е U* | x* е A.iu,)}, i е I - множество таких управлений, при которых действие xi является допустимым для
n
i-го АЭ; U(x) = ^ U^ (x^) . Минимальные затраты центра на обес-
i=1
печение допустимости вектора действий x е A' равны:
(6) X(x) = min c(u).
и eU (x)
Из результатов четвертого раздела настоящей работы следует, что в рассматриваемой модели суммарные затраты центра по
n
реализации действия x е A' равны ^(x) = X с^ (x) + ;˜(x). Опти-
i=1
мальным для центра действием АЭ является действие у*, максимизирующее разность между доходом центра и его затратами на стимулирование:
n
(7) у* = aгg max {H(x) - ^(x)} = aгg max {H(x) - X с, (x) - c˜(x)}.
xe A xe A i_1
Итак, выражение (7) дает оптимальное решение задачи управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ.
Исследуем теперь задачу синтеза унифицированных управлений, то есть предположим, что центр имеет возможность назначать персонифицированное стимулирование каждому из АЭ, но должен выбрать одно значение управляющего параметра, единое для всех АЭ, то есть и* = и, U* = Uu, i е I.
Обозначим UU(x) = {и е UU | V i е I x* е A (и)} - множество таких управлений, при которых действие xi является допустимым
136
для i-го АЭ, i е I. Минимальные затраты центра на обеспечение допустимости вектора действий xeA' равны: CU (x) =
min CU(u), где xU: UU (r) Ш1 - функция затрат центра.
ueUu(x)
Оптимальным для центра действием АЭ является следующее действие:
* n ˜
(5) y* = aгg max {H(x) - X с, (x) - ;˜u (x)}.
xeA' i_1
Выражение (8) дает оптимальное решение задачи синтеза унифицированного управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ.
Обозначим эффективности оптимальных управлений (соответственно, "обычного" и унифицированного):
n
(9) K* = H(y*) - X с,. (у ) - ;˜(v*),
i_1
(10) K* = H( y*) - X с,- (у*) - ;˜U (У*),
i_1
и сравним величины K* и KU* , то есть оценим качественно потери
в эффективности управления, вызванные необходимостью использовать единые для всех АЭ значения управляющего параметра, определяющего множества допустимых действий. Введем следующее предположение о монотонности множеств допустимых действий АЭ по управляющему параметру:
А.8.1. VieI, V и!, uf е U, = Ш1: и! ? uf (r) A,, uj) с A,( uf );
V и1, и2 е UU = Ш1: и1 ? и2 (r) V i е I A.iu1) с A.iu2). Введем также предположение об аддитивности и монотонности функций затрат центра:
nn
А.8.2. С(и) = X Сi (и,), Cu(u) = X Сi (и) .
i_1 i_1
137
Теорема 8.1. Если выполнены предположения А.8.1 и А.8.2, то
K* > KU. Если при этом ;,-() - монотонно возрастающие функции,
**
leI, то уи ? у .
Справедливость утверждения теоремы 8.1 следует из выражений (6)-(10), а также того, что в рамках предположений А.8.1 и А.8.2 выполнено следующее соотношение: VyeA' (у) ? ;˜U (у). •
Пример 12. Пусть n = 2, Н(у) = a/ y/ + a2 у2, сг(уг) = у2 /2гг,
Хг(иг) = bi и,, Aiiu,) = [0; и,], i е I.
Обозначим a = min a., Ь = max Ь* и предположим, что a > р.
i _ 1, n i _1,n
Тогда оптимальны действия АЭ: у* = (ai-bi)Гi, у*и = (ai-р)Гi, i е I,
фф K* (a, - bi )2 (ai - b)2
а эффективности равны: K = X , KU = X .
i_1 2г^ i_1 2г^
Видно, что у* > y*u , i e I, K* > KU. •
Итак, выше в настоящем разделе мы рассмотрели общие вопросы учета глобальных ограничений на множества допустимых действий АЭ при решении задач стимулирования в многоэлементных АС, а также задачи управления многоэлементными АС, в которых центр, помимо выбора системы стимулирования, имеет возможность управлять множествами допустимых стратегий активных элементов. Перейдем к рассмотрению нескольких практически важных частных случаев, в которых используются полученные теоретические результаты.
9. ПРОИЗВОДСТВЕННЫЕ ЦЕПОЧКИ
Производственной цепочкой называется АС, в которой АЭ упорядочены таким образом, что ограничения деятельности (ограничения на выбор стратегией) каждого АЭ определяются действием, выбранным АЭ с меньшим номером, а действие, выбранное данным АЭ, определяет ограничения деятельности АЭ с большим
138
номером, причем АЭ выбирают действия последовательно в порядке, соответствующем их упорядочению. Производственные цепочки61 адекватно отражают широко распространенные на практике условия взаимодействия экономических объектов, для которых результат деятельности (в детерминированных моделях совпадающий с действием - см. седьмой раздел настоящей работы) одного объекта (продукция) является, например, сырьем, используемым другим объектом и т.д. В рассматриваемой ниже модели считается, что действие, выбранное определенным АЭ, задает множество возможных действий следующего АЭ и т.д. Содержательные интерпретации такой зависимости очевидны.
Пусть в многоэлементной АС активные элементы упорядочены так, что множество возможных действий i-го АЭ определяется
действием i-1-го АЭ: A* = Ai(yi-/), i = 2, n . Примем, что множество допустимых действий первого АЭ зависит от выбранного центром значения управляющего параметра и е U, то есть A/ = A/(u).
Порядок функционирования следующий: центр выбирает систему стимулирования {о()} е М и управление и е U. Затем АЭ последовательно выбирают свои действия, причем на момент выбора действия каждый АЭ знает: целевые функции и допустимые множества (с точностью до конкретного значения параметра) всех участников АС, выбор центра и действия, выбранные АЭ с меньшими номерами.
Целевая функция АЭ имеет вид: (1) fity,, о) = Oi(Vi) - сг(у),
то есть будем считать, что затраты АЭ сепарабельны. Для обоснования этого предположения можно привести следующее рассуждение. Если затраты i-го АЭ зависят от действий АЭ с меньшими номерами, то эту зависимость можно исключить из рассмотрения, так как на момент выбора им своей стратегии действия АЭ с меньшими номерами будут ему известны. Будем считать, что зависеть от действий АЭ с большими номерами затраты i-го АЭ также не могут, так как их действия выбираются позже и зависят (иногда однозначно - в рамках принятой гипотезы рационального поведения) от действия i-го АЭ.
Структура взаимодействия участников производственной цепочки изображена на рисунке 6.

с1(у1), A1(u) с2(У2), A2(y1) с1(Уг), Ai(yr-1)
Рис.6. Производственная цепочка
АЭ1
y1 5
АЭ2

сп(УП), Лn(Уn.l)

Введем следующее предположение:
А.9.1. Ai(Vi-1) = [0; A+ (у-1)] с , где A+: (r) - непрерывная строго монотонно возрастающая функция, такая, что A+ (0) = 0, i е I, у0 = и е U = [0; u^ax].
Если выполнено предположение А.9.1, то существуют n непрерывных строго монотонно возрастающих функций ^г(уг), обратных к функциям Ai+, которые позволяют "перевернуть" производственную цепочку, то есть по заданному значению действия n-го АЭ восстановить минимальные действия всех предшествующих АЭ и управление центра, делающих это действие допустимым.
Пусть xn > 0 - фиксированное действие n-го АЭ. Для того чтобы оно было допустимым должно выполняться xn ? An+ (xn-1), то
есть xn-1 > Xn(xn). Выберем xn-1 = Xn(xn). Для допустимости действия xn-1 должно выполняться следующее соотношение: xn-2 > Xn-1(xn-1).
140

Выберем xn-2 = Xn-1(xn-1) = Xn-1(Xn(xn)) и т.д.
Таким образом, допустимые планы (действия АЭ) определяются следующим образом:
(2) xi(xn) = Xi+1(Xi+2(. XmiXnixn)))), i = 1, n - 1.
Управление со стороны центра должно удовлетворять:
(3) u(xn) = Xn(xn))).
С другой стороны, по известным зависимостям (), i е I, и
значению и ? u"ax можно восстановить ограничения (и) на
максимальные допустимые действия каждого АЭ:
(4) Amax(u) = A+ ( A;-1(.A+ (u))), i e I.
Обозначим ;(и) - затраты центра на управление и сформулируем полученный (очевидный, но необходимый для решения задачи управления) результат в виде леммы.
Лемма 9.1. Если выполнено предположение А.9.1, то в производственной цепочке реализуемы такие и только такие действия yeA', которые удовлетворяют:
у е A* = {у е A' | у, > Хг+1(Уг+1), i = 1, n - 1, u"ax > Х1(У1)}, или, что то же самое:
у е A* = {у е A' | у1 ? A+ (umax), у, ? A+ (уг-1), i = 2, n }. Минимальные затраты центра на реализацию вектора действий ye A', удовлетворяющего приведенной системе неравенств, равны
(5) Jiy) = Х(Х1(У1)) + X с,- (У,).
i_1
Докажем справедливость выражения (5). Минимальное значение управления и ? umax, делающее допустимым действие у1 первого АЭ равно X1(y1). Значит, для этого центр должен потратить C(X1(y1)). Кроме того, действия АЭ у*, i е I, должны быть реализуемы, то есть на них должны достигаться максимумы целевых функций АЭ. Для этого достаточно использовать квазикомпенсаторную систему стимулирования, требующую (как известно из результатов четвертого раздела настоящей работы) минимальных затрат на
141
стимулирование62 X с* (У*) . •
i_1
Воспользуемся результатом леммы 9.1 для решения задачи синтеза оптимальных управлений. Если Н(у) - функция дохода центра, то оптимальным реализуемым вектором действий будет вектор
(6) у* = aгg ma^ {Н(у) - х(Х1(У1)) - X с,- (У,-) }.
yeA i_1
При решении оптимизационной задачи (6) могут возникнуть как вычислительные трудности, обусловленные сложной структурой задания множества A*, так и трудности с анализом зависимости оптимального решения от параметров модели. Напомним, что задача (6) формулировалась следующим образом: фиксировалось действие последнего АЭ, после чего по выражению (2) определялось множество допустимых действий предшествующего АЭ и так далее, вплоть до определения по множеству действий первого АЭ множества управлений центра. Построенное таким образом множество A допустимых (для всех допустимых управлений) действий как раз и является тем множеством, на котором максимизируется целевая функция центра (см. (6)).
В частном случае (см. конкретизацию ниже) возможен альтернативный подход. Для фиксированного управления ие U определим множество действий АЭ, допустимых при данных управлениях: A.iu) = [0; A.^^^ (u)], где A^^^ (u) вычисляется в соответствии с
(4). Найдем вектор действий у*(и), максимизирующий разность между доходом центра и его затратами на стимулирование на
n
множестве A (и) = ^ A* (и) :
i_1
n
У*(и) = aгg max {Н(у) - Xс^ (У,)}.
yeA(u) l_1

Обозначим J(u) = Н(у*(и)) - X с, (у*(м)) . Если V i е IV и е U
i=1
у* (и) = ), то оптимально следующее значение управле
ния: и* = aгg max {J(u) - c(u)}.
ueU
При использовании предложенного подхода наибольшую трудность (в первую очередь - вычислительную) представляет задача определения зависимости у*(и), второй же этап - этап поиска оптимального значения управления является скалярной задачей оптимизации.
Рассмотрим задачу стимулирования первого рода63, в которой целевая функция центра не убывает по действиям всех АЭ. Если воспользоваться монотонностью и непрерывностью функций
A'+ (•), обеспечиваемой предположением А.9.1, то можно предложить более простой (нежели чем использовался для задачи второго рода) метод решения задачи стимулирования, в котором по сравнению с выражением (6) существенно упрощается вид допустимого множества.
Теорема 9.1. Если выполнено предположение А.9.1, то оптимальное решение задачи стимулирования первого рода, в которой целевая функция центра не убывает по действиям всех АЭ, для рассматриваемой производственной цепочки имеет вид:
(7) " = и*, Oitvi) = |с'<
0, У, - у, (и )
где у (и) = (y^iu), y^iu), у"{и)), у*{и) = A++iu), у, (м) =
A (Vi-iu)), i = 2,n,
и = aгg max {H(y (и)) - c(u)}.
ueU
*
и =
Применим полученные результаты для частного, но чрезвы-
чайно часто встречающегося на практике, случая, когда доход центра Н = H(xn) зависит только от действия последнего АЭ в производственной цепочке. Содержательно, при этом последний АЭ производит конечную продукцию, а центр поставляет на вход производственной цепочки исходное сырье в объеме и е [0; итса]. Ограничение на максимальный объем исходного сырья порождает ограничение на множество X возможных действий последнего АЭ:
(8) xn е X = [0; x"ax], x"ax = An+ ( A,+-1(. A1+ (u"ax))).
Для реализации действия xn n-го АЭ центр должен поставить исходное сырье в объеме u(xn) = X1(X2(. Xn(xn))) (см. выражение (3)). Суммарные затраты на управление при этом равны (см. выражение (2)):
(9) J(xn) = Z(X1(X2(.Xn(xn)))) +
n-1
+ X Cг(Xг+l(Xг+2(.Xn-l(Xn(Xn)))))+Cn(Xn). i=1
Оптимальное решение задачи управления (оптимальное реализуемое действие n-го АЭ) является решением следующей скалярной задачи оптимизации:
(10) x* = aгg max {H(xn) - J(xn)},
xn eX
где множество X определяется выражением (8), а суммарные затраты на управление - выражением (9).
Выражения (8)-(10) свидетельствуют о том, что в рассматриваемой модели производственная цепочка может быть заменена одним активным элементом, имеющим зависимость правой границы множества допустимых действий от управления, отражаемую выражением (8), и функцию затрат:
n-1
C(x) = X Ci(Xi+1(Xi+2(^. Xn-1(Xn(x))))) + Cn(x). i=1
Затраты центра на управление (без учета затрат на стимулирование) при этом определяются: ;˜(x) = c(X1(X2(. Xn(x)))). Решение задачи стимулирования в АС с таким (одним!) АЭ (см. также выше теорему 8.1 и модель, для которой она была сформулирована) совпадает с решением (10) задачи управления производственной цепочкой из n АЭ.
144

Двойственным подходом является рассмотрение в рамках предположения А.9.1 явной зависимости реализуемого действия n- го АЭ от управления и е U центра. При этом максимальное реализуемое действие n-го АЭ связано с управлением следующим образом:
xn ?xmax(u) = A^ ( A+-1( . A+ (U))). Затраты центра на управление (с учетом затрат на стимулирование), зависящие только от управления, равны:
Jiu) = c(u) + XXCI (A; ( A;-1(... A+ (M)))).
i=1
Реализуемым оказывается следующий вектор действий АЭ: у* (и) = A+ iAl+l1i...Aj^(и))), i е I, следовательно, решение задачи
управления имеет вид:
* *
и = aгg max {Н( УП (и)) - Jiu)}.
ueU
Пример 13. Пусть A+ (уг-1) = g, Уг-1, g, > 0, с-Су,) = у2 /2гг,
i
A^i = и, х(и) = b и, Н(УП) = a УП. Обозначим 1, = ^ gj и допус-
7=1
тим, что a 1n > b, тогда xmax = 1n umax, а целевая функция центра
n I2
X ^^
i=1 гг
x 21
2
имеет вид: F(x) = (a - b / 1П) x -
Если ограничения на максимальный объем исходного сырья отсутствуют, то оптимальным оказывается следующее реализуемое
n2
.-1 г
действие n-го АЭ: x* = (аЯП - b 1n) /
' n 12
i-1 гг
Двойственный подход заключается в выражении целевой функции центра через управляющий параметр и.
i2
Имеем: у. = и, ieI, тогда Ф(и) = (a 1П - b) и -
145
2

. При этом,
Вычисляем и* = aгg max Ф(и) = (a1n - b) /
u>0
_i-1 гг
естественно, выполнено x' = Xn и". Если рассматривать b как цену за сырье, a - как цену за готовую продукцию, а 1/Xn - как "коэффициент усиления" производственной цепочки, то неравенство a > b можно интерпретировать как условие того, что отношение "выходной" и "входной" цен должно быть не меньше "коэффициента усиления" рассматриваемой системы. •
В проводимом выше рассмотрении производственных цепочек считалось, что каждый АЭ выбирает свою стратегию сразу после того, как выбрал свою стратегию предшествующий АЭ, то есть никак не учитывался фактор времени. Рассмотрим некоторые способы учета времени64 в моделях производственных цепочек.
Пусть в результате решения задачи стимулирования для производственной цепочки получены значения оптимальных планов. Предположим, что i-му АЭ для выполнения плана (без дополнительного стимулирования за сокращение времени) требуется время t., i е I. Сокращение времени выполнения заданного (фиксированного) плана на время Dt. требует от i-го АЭ дополнительных затрат C.iDtl), где сг( ) - монотонная выпуклая функция, с.(0) = 0, i е I. Тогда продолжительность всего производственного цикла равна
T = T0 - AT, где T0 = XT,, DT = X At, .
i-1 i-1
Сокращая время выполнения плана на AT, центр получает до-
n
ход H(AT) и несет затраты C(AT) = X CI (А T.).
i-1
Пример 14. Пусть центр может вкладывать и привлекать средства по ставке 5%. Предположим, что выполнение одного производственного цикла требует от центра вложений (затраты на сырье, стимулирование АЭ и т.д.) Co собственных средств и дает доход (независимо от времени завершения цикла) доход Н0.
Тогда, сокращая продолжительность цикла на время AT, центр к моменту T получает дополнительный доход H(AT) = Н0 ( q AT -1).
Другая интерпретация зависимости дохода от времени заключается в следующем. Пусть центр привлек внешние средства в объеме C0. Тогда сокращение продолжительности производственного цикла приведет к сокращению платежей по процентам. Условие выгодности выполнения производственного цикла на привлекаемые средства за время T0 имеет вид: С0 q5T0 ?Н0. Выигрыш от сокращения времени равен: H(AT) = С0 q5 T0 (1 - q˜5).
Возможны также варианты линейного дохода: H(AT) = 5 AT. Содержательно последний случай соответствует тому, что центр выплачивает постоянную сумму за единицу времени аренды оборудования (или хранение промежуточной и конечной продукции), или постоянные (в единицу времени) штрафы за загрязнение окружающей среды в процессе производства и т.д. •
Решение задачи управления разбивается на два этапа. Первый
этап - поиск таких величин сокращения времени каждым АЭ: At. ,
i е
I, которые минимизируют затраты при условии AT = X At. :
i-1
Xс^ (At,) (r)n min .
l -1 XX At, - AT
i-1
Результатом первого этапа является зависимость минимальных затрат от времени сокращения продолжительности всего цикла:
" n *
с (AT) = X c^ iA t* ) . Второй этап заключается в поиске такого
i-1
времени сокращения AT, которое минимизировало бы разность между доходом и минимальными затратами:
147

AT* = aгg max {H(AT) - c*(AT)}.
AT >0
Пример 15. Пусть АЭ имеют следующие функции затрат: ci(Atl) = г. (piAt./г,), где ji) - монотонная выпуклая функция,
n
p(0)=0. Тогда c*(AT) = W p(p'(AT/W)), где W = Xг, (см. подроб-
i-1
ности в [7, 36].
Пусть имеет место случай линейного дохода, то есть H(AT) = 5AT, тогда AT* определяется как решение уравнения: (^'(p'(AT/W)) p''(AT/W) = 5. Например, если АЭ имеют квадратичные затраты, то есть выполнено: piz) = z2/2, то At* = г. 5, i е I, AT* = 5 W. •
Итак, мы описали алгоритм поиска оптимальной продолжительности производственного цикла для фиксированного плана. Варьируя все допустимые планы (см. выше), можно получить множество значений целевой функции центра при различных комбинациях планов и продолжительностей, а затем выбрать ту их комбинацию, которой соответствует максимальная эффективность управления, то есть максимальное значение целевой функции центра.
Таким образом, мы решили задачу управления (с учетом времени) для производственной цепочки, в которой для каждого плана каждого АЭ известны затраты на сокращение времени по выполнению этого плана. В более общем случае могут быть заданы зависимости затрат АЭ одновременно от планов и времени: с.(у., t.), i е I. Относительно зависимостей с.(-, ) обычно предполагается, что это гладкие функции своих переменных, обладающие следую-
^с Dc- D2 C- D ^C- щими свойствами: -- > 0, -- < 0, ^ > 0, ^ > 0,
DVi Dt, DVi' Dti'
D 2 с.
- < 0, ieI. Примером могут служить функции: с.(у., t,) =
Dy, DT-
(yi/ti)2/2гi (содержательные интерпретации очевидны).
148
Выражения (2)-(3) и (8)-(9) позволяют однозначно выразить
n
план i-го АЭ через план n-го АЭ: у. = у.(уп). Пусть T = Xt. - про-
i-1
должительность производственного цикла при временах {т.}, Х(и(^п), т1, т2, ..., тп) - штрафы (или доход) центра. Обозначим Jiyn, T) - минимальные затраты центра на реализацию плана уп за время T. Таким образом, Луп, T) - результат решения следующей задачи:
n
JiVn, T) = х(и(Уп), Т1, Т2, Тп) + Xс- iУг iУп ), 11) (r) min .
l -1 Xti -T
i-1
Имея зависимость Луп, T) можно найти оптимальный план п- го АЭ и оптимальную продолжительность производственного цикла:
H(xn) - Jiy^, T) (r) max .
Уп е X, T > 0
Завершив краткое обсуждение проблем учета фактора времени в управлении производственными цепочками, вернемся к анализу задач стимулирования.
Выше мы рассматривали производственную цепочку, в которой центр использовал оптимальную - квазикомпенсаторную - систему стимулирования. На практике распространены ситуации, когда результаты деятельности экономических объектов продаются и покупаются по фиксированной цене за единицу продукции, сырья и т.д. Этот случай соответствует использованию пропорциональных систем стимулирования.
Рассмотрим i-ый АЭ производственной цепочки, который имеет возможность приобретать сырье (результат деятельности i-1- го АЭ) у предшествующего АЭ, центра или вне рассматриваемой АС (например, на рынке) по цене ai и продавать свою продукцию (i+1-му АЭ, центру или вне АС) по цене b*. Закупка сырья в объеме ^.(у.), минимально необходимом для производства продукции в объеме у., требует затрат с^ Х.(Уг). Собственные затраты i-го АЭ равны Ci(Vi), а получаемый им от продажи продукции доход равен b. у,. Таким образом, целевая функция i-го АЭ имеет вид: (11) fiia,, bi, Уг) = bi Уг - сг(Уг) - С, Хг(Уг), - е I.
149
Обозначим у* (a,, bi)= aгg max fia,, b., у), i e I.
у>0
Если АЭ составляют производственную цепочку, то есть продают сырье и продукцию друг другу в последовательности, определяемой используемой технологией, то должно выполняться:
(12) a, = bi-1, i e I,
где a1 = b0 - цена продажи сырья центром, а bn = a0 - цена, по которой центр покупает готовую продукцию.
Условие баланса (ненакопления продукции и сырья) имеет
вид:
(13) yi*_1 (а.-1, bn) = Xi( У* (С, bi)), i е I.
Необходимым условием успешного функционирования производственной цепочки является существование таких цен и объемов выпуска, при которых существует вектор действий, такой, что значения целевых функций (11) всех АЭ неотрицательны65:
(14) fiia., bi, У*(С, bi)) > 0, i е I.
Кроме этого, необходимо, чтобы значение целевой функции центра было неотрицательно:
(15) Н(( у*(а1, b1), y*(an, bn))) + a1 X1( У*(а1, b1)) -
- bn y*(an, bn)) > 0,
где H(y1, yn)- доход центра от функционирования производственной цепочки. Например, если центр закупает сырье на рынке по цене аг и продает готовую продукцию на рынке по цене ЬГ, то:
(16) Н(У1, Уп) = ЬГ Уп - Сг Х1(У1).
Следует отметить, что в рассматриваемой модели центр играет роль "спекулянта" (то есть "играет" на разнице цен (а1 - аг), (Ьг - bn)) и, если это позволяют содержательные интерпретации модели, может быть исключен из рассмотрения приравниванием его собственных цен рыночным : a1 = аг, Ьп = Ьг.
Роль центра может быть иной - предположим, что он сам покупает у элементов продукцию и продает им сырье по фиксированным ценам (так называемые внутренние цены). В этом случае условия (12) и (15) уже не имеют места. Содержательно, центр может поддерживать одних АЭ, снижая для них цену на сырье за счет собственных ресурсов, например - за счет занижения цен покупки продукции у других АЭ, кратковременного привлечения беспроцентных (в рассматриваемой модели) внешних средств и т.д. В этом случае для него должно выполняться условие неотрицательности финансового баланса за весь производственный цикл:
(17) X {С Xi( У* (С, bi)) - Ьг у* (Сг, Ьг)} + i-1
+ Ьг У* (Сп, Ьп) - Сг Х1( У* (а1, b1)) > 0. Обозначим: a = (a1, a2, Сп), Ь = (Ь1, Ь2, Ьп),
L = {(а,Ь) | ^ i е I (а.,Ьг) удовлетворяют (12)-(16)}, L* = {(а,Ь) | ^i е I (аг,Ьг) удовлетворяют (13), (14) и (17)}. Области L и L задают для соответствующих моделей множества допустимых цен. Если оказывается, что L = 0 (L = 0), то это означает, что не существует цен, при которых данная производственная цепочка может функционировать. Другими словами, условие L ^ 0 (L ^ 0) является условием реализуемости (устойчивости) соответствующей производственной цепочки. Лемма 9.2. L с Л*.
Покажем, что, если для некоторого набора цен (a, b) выполнены условия (12)-(16), то для него же выполнены и условия (13), (14) и (17). Подставляя (15)-(16) в (17), замечаем, что достаточно показать, что выполнено
(18) X {с- Xi( У*) - Ьг у*} + Сп Xn( у*) - b1 у* > 0.
Воспользовавшись (13), из (18) получим:
nX[1 {а, у^.1 - Ьг у*} + Сп у*_1 - b1 У* ^ 0-
i-2
n n_1
Воспользовавшись (12), получим: X Ь.-1 У.-1 - X Ь. У. - 0.
i-2 i-1
Левая часть последнего неравенства тождественно равна нулю. •
Содержательно лемма 9.2 означает, что, если центр сам осуществляет координацию покупки и продажи в управляемой АС, то множество равновесных цен, а, следовательно, и множество допустимых состояний системы шире66, чем в случае, когда центр осуществляет только закупку исходного сырья и реализацию готовой продукции. Другими словами, лемма 9.2 дает объяснение системообразующего фактора - объединение АЭ в систему и наличие управляющего органа - центра - приводит к расширению множества допустимых состояний системы, что может рассматриваться как теоретическое обоснование выгодности для ряда случаев существования объединений экономических объектов, связанных единым технологическим циклом, по сравнению с независимой деятельностью каждого из них как субъекта рынка.
Пример 16. Пусть п = 2, A+ (уг-1) = g, Уг-1, g, > 0, с-Су,) = у67 /2гг,
A-+ = и. Кроме того, предположим, что центр продает АЭ сырье и покупает готовую продукцию по рыночным ценам, то есть а1=аг, b2 = Ьг. Вычисляем у* = (Ь. - а,/^-) г., i = 1, 2. Выписывая систему неравенств (12)-(16) и преобразовывая ее, получаем, что производственная цепочка осуществима, если выполнено следующее условие:
= - ,axl 1 • Гlig2)2 + (г2)
Г1 h 71 72 г2 Отметим, что в левой части неравенства фигурируют цены (в том числе - рыночные), то есть внешние по отношению к АС
аг а1
параметры, а в правой части - параметры самой производственной цепочки. Поэтому последнее неравенство содержательно может интерпретироваться как ограничение на множество рыночных цен, при которых данная производственная цепочка может успешно функционировать, или как ограничение на множество значений параметров производственной цепочки, при которых она может успешно функционировать при данных рыночных ценах на сырье и готовую продукцию. •
Выше в настоящем разделе рассматривались производственные цепочки, в которых АЭ по одному последовательно выбирали свои стратегии. Обобщим полученные результаты на случай произвольной технологической сети - "обобщенной" производственной цепочки.
Пусть множество I активных элементов разбито на T непересекающихся подмножеств {It}, t = 1, T, I. n Ij = 0, i ^j, i, j = 1, T,
I It = I, кроме того, пусть выполнено: ^ к е It, ^ l е It+1 к < l, t-1j
t = 1,Т _ 1. Предположим, что АЭ из множества It выбирают свои стратегии одновременно и независимо в момент времени t, а множество допустимых действий любого АЭ из множества It зависит от действий, выбранных АЭ из множества It-1 (в предыдущем периоде): Ai(Yt-1) = [0; Ai+ (Yt-1)], i e It, где Yt - вектор действий АЭ из
множества It, t = 1, T, A. = [0; u.], i e I1. Управление и = (u1, u2,
M|I1|) e U' = ^ U^ выбирается центром.
ieI1
Содержательно, технологический цикл в рассматриваемой модели состоит из T этапов, в течение каждого из которых выполняются независимые операции, причем для начала работ по каждому из этапов требуется завершение работ предыдущего этапа, и результаты предыдущего этапа определяют множество результатов, которые могут быть достигнуты на данном этапе. Множество результатов, которые могут быть достигнуты на первом этапе, зависят от управлений со стороны центра (например, поставок исходного сырья для всего производственного цикла).
153
Относительно функций затрат АЭ сделаем следующее предположение: функции затрат несепарабельны, но затраты каждого АЭ зависят только от действий АЭ, выбирающих свои действия в том
же периоде, то есть с. = ci(Yt), i е It, t = 1, T (см. содержательное
обоснование этого предположения выше).
Итак, центр имеет возможность выбирать управляющие параметры и е U', неся при этом затраты ^(и), и назначать систему стимулирования {а.()}. Будем считать, что в общем случае стимулирование АЭ зависит только от действий АЭ, выбирающих свои
действия в том же периоде, то есть о. = si(Yt), i е It, t = 1, T .
Относительно функции дохода центра предположим, что она зависит от действий всех АЭ.
В силу причинно-следственных связей (технологических зависимостей) игра АЭ распадается на T последовательно разыгрываемых игр, множество допустимых стратегий АЭ в каждой из которых (за исключением первой) определяется решением предыдущей игры, а множество допустимых стратегий АЭ в первой игре определяется управлением со стороны центра. Для каждой из этих игр могут быть независимо использованы результаты синтеза оптимальных функций стимулирования в многоэлементных АС с несе- парабельными затратами1 (см. модель S4 выше). Значит, остается "связать" эти игры между собой.
Одним из возможных способов учета последовательной взаимозависимости результатов различных периодов является использованный выше при рассмотрении "обычных" производственных цепочек метод, заключающийся в последовательном установлении зависимости максимальных допустимых действий АЭ и управлений центра. Введем следующее предположение
А.9.2. c( ), Ai+ ( ) и c.i ), i е I - непрерывные, строго монотонные функции своих переменных.
1* В частности, для того, чтобы в t-ой игре вектор Yt был равновесием в
доминантных стратегиях требуются (минимальные!) затраты на
стимулирование, равные: X Cj iYt ).
jeIt
154
Фиксируем вектор YT = (yn_\IT\, уп) е AT = П A. . Вычис-
ieIT
лим такое множество A T-1(YT) е AT-1 = П A. векторов действий
ieIT _1
АЭ, принадлежащих множеству IT.^l• выбор которых обеспечивает
допустимость вектора YT, то есть A (YT) = {YT.^leAT.^l | YTeAT(YT-1)}. Продолжая аналогичным образом, получим совокупность множеств:
Aj = {Yj е Aj I Yj+1 e Aj+1(Yj) }, j = 1,T _ 1. Вычислим множество векторов управлений, обеспечивающих допустимость вектора Y1: U (Y1) = {u e U | Y1 e A1(u)}.
Таким образом, реализуемыми оказываются такие и только такие вектора действий АЭ, которые удовлетворяют одному из следующих условий:
(19) и е U, Y1 е A˜˜u), Yj е Aj j = 'l^T;
(20) YT e AT, Yj e A j(Yj+1), j = 1,T _ 1, и e U (Y1).
Условия (19) и (20) отражают технологические ограничения, наложенные на "одновременный" выбор действий АЭ-участниками производственной цепочки.
Обозначим A* - множество всех векторов действий АЭ и управлений центра, которые удовлетворяют условиям (19) или
(20) . Тогда задача синтеза оптимального управления заключается в выборе реализуемого (из множества A ) вектора действий АЭ и вектора управлений, максимизирующих целевую функцию центра:
T
(21) (и*, у*) = aгg max * {Н(у) - c(u) - XX с, (Yt) }.
(u• у t-1 ieIt
Задача чрезвычайно трудоемка с вычислительной точки зрения. Кроме того, без детального анализа трудно предложить какое- либо ее простое (оптимальное или "почти"-оптимальное) решение68.
Допущение о том, что функция дохода центра зависит только от действий АЭ, выбираемых в последнем периоде, в обобщенных производственных цепочках, в отличие от "простых" производственных цепочек (см. (8)-(10)), в общем случае не упрощает задачи (21). Качественно это объясняется тем, что для действия некоторого АЭ в общем случае существует несколько действий АЭ с меньшими номерами, делающих это действие допустимым с минимальными затратами.
Если предположить, что A+ (•), i е I, - взаимно однозначные
отображения69, то по аналогии с "обычной" производственной цепочкой для заданного вектора действий АЭ из множества IT однозначно (!) вычисляются соответствующие вектора действий АЭ из множества IT-1 и т.д. (см. (8)-(10)).
При Н = H(YT) для задачи (21) может быть использован следующий эвристический алгоритм70 последовательной минимизации затрат, достаточно часто применяемый на практике. Для АЭ из множества IT решается задача синтеза оптимальной системы стимулирования - ищется действие xT = aгg max {H(yT) -
Ут е AT
X c^ iYT )}. Далее для АЭ из множества IT-1 решается задача сти-
ieIT
мулирования: xT-1 = aгg rnin X Ci (YT_1) и т.д., то есть на
Ут eAT _1( xT) ieIT _1
каждом шаге от Т-1-го до первого минимизируются затраты по реализации действий, обеспечивающих допустимость действий, вычисленных на предыдущем шаге. Если включить в рассматриваемую модель фактор времени, то такой эвристический подход вполне согласован с используемыми в сетевом планировании и управлении методами оптимизации сетей по времени и стоимости (см., например, [5, 11, 23]).
10. МЕХАНИЗМЫ СТИМУЛИРОВАНИЯ И ЗАДАЧИ ФОРМИРОВАНИЯ СОСТАВА АКТИВНОЙ СИСТЕМЫ
В предыдущих разделах настоящей работы рассматривались задачи стимулирования в многоэлементных активных системах с фиксированным составом участников, то есть набор активных элементов, подчиненных центру, был фиксирован. Коль скоро мы умеем решать задачу стимулирования для фиксированного состава АС, появляется возможность рассмотрения задачи формирования состава активной системы, то есть задачи определения оптимального (в оговариваемом ниже смысле) набора АЭ, которых следует включить в систему, и тех их действий, выбор которых наиболее выгоден для центра. Приведем формальную постановку задачи.
Пусть имеются N АЭ - потенциальных участников (претендентов на участие) активной системы. Обозначим: ^ - множество всех подмножеств множества71 N = {1, 2, N} и {0}, I е ^ - некоторый элемент этого множества - состав АС, включающий п активных элементов |I| = п ? N.
Из предшествующего изложения известно, что в отсутствии ограничений на стимулирование минимальные затраты центра по побуждению АЭ из множества I к выбору вектора действий
У: е Ai = П Ai равны72
ieI
(1) Jiyi) = X c-i i VI ).
ieI
Если функция дохода центра Н( •, I) в АС с составом I определена на множестве AI действий АЭ, входящих в АС, и равна нулю
при I = 0, то есть
(2) Н(, I) = H(yi),
то эффективность оптимального управления составом I равна
(3) F(I) = max {H(yi) - J(yi)}.
У: e Ai
Тогда задача определения оптимального состава АС может быть формально записана как задача определения допустимого состава I, |I | = n , максимизирующего эффективность (3):
(4) I* = aгg max F(I)
I еК
при условии, что F(I) - 0.
Последнее условие означает, что выигрыш центра должен быть неотрицателен (условие индивидуальной рациональности центра), так как центр всегда имеет возможность получить нулевой выигрыш, не включая в состав АС ни одного АЭ.
Формулировка и решение задачи (4) в общем случае сопряжено с двумя трудностями. Во-первых, если затраты на стимулирование (1) определяются для произвольного состава АС тривиально (переход от одного состава АС к другому составу производится так, что сумма затрат АЭ вычисляется по АЭ, включенным в АС), то способы определения функции дохода центра (2) и индивидуальных затрат АЭ ci(yI) (в общем случае зависящих от действий всех АЭ, входящих в АС) не столь очевидны. Действительно, нужно четко представлять для любого состава I е ^ как с содержательной, так и с формальной точки зрения, к каким изменениям дохода центра и затрат каждого из АЭ приводит замена произвольного АЭ i е I на произвольный АЭ j е N \ I.
Вторая трудность заключается в высокой вычислительной сложности задачи (4). Число элементов множества Н равно 2N, то есть велико и быстро растет с ростом N.
Для определения оптимального состава АС необходимо для каждого набора АЭ I е Н решить задачу стимулирования, то есть при N потенциальных претендентах на участие в АС необходимо решать 2N задач стимулирования, а затем в соответствии с (4) искать состав, максимизирующий целевую функцию центра. Другими словами, вторая трудность является традиционной "пробле-
158
мой" дискретной оптимизации73. Следовательно, необходимо предлагать эвристические алгоритмы решения, оценивать их сложность, эффективность и т.д.
Частным случаем задачи определения оптимального состава АС, является задача оптимизации заданного состава АС, формулируемая следующим образом. Имеется АС, включающая множество АЭ I0. Известно также множество J потенциальных участников, I0 и J = N и задан критерий эффективности К(Г) состава I е Н. Требуется найти оптимальный состав, то есть
I* = aгg max K(I).
I еК
Частным случаем задачи оптимизации заданного состава АС,
является задача определения максимальных подмножеств A е 210 и B е 2 таких, что A сI*, Б^I*. Еще более частной является (случай, когда |A| = 1 или |B| = 1) задача принятия решения об увольнении или найме одного АЭ - так называемая задача о приеме на работу.
Прежде чем переходить к изложению оригинальных результатов по задачам синтеза состава АС, приведем краткий обзор подходов и результатов решения этого класса задач, полученных в теории управления социально-экономическими системами.
Впервые в теории активных систем задачи формирования состава АС рассматривались в работе [5] для случая назначения проектов. Вообще, задача о назначении с неизвестными центру и сообщаемыми ему активными элементами параметрами эффективности их деятельности на различных должностях неоднократно привлекала внимание исследователей, особенно в области управления проектами - так называемые сложные конкурсы исполнителей и др. [21].
В работе [8] рассмотрена модель динамики трудовых ресурсов между несколькими предприятиями в зависимости от условий оплаты труда и неденежных факторов вознаграждения работников.
Обширный класс задач определения оптимального числа нанимаемых работников в зависимости от внешних условий рассматривался в работах по теории контрактов [57-65]. Обзор основных результатов прикладных задач теории контрактов (так называемых "трудовых контрактов") приведен в [9]. Обычно в работах зарубежных авторов по теории контрактов считается, что на момент заключения контракта будущее значение состояния природы (внешнего неопределенного фактора, определяющего условия функционирования АС) неизвестно ни центру, ни потенциальным работникам, но они имеют о нем информацию в виде вероятностного распределения. Задача центра заключается в определении зависимости вознаграждения работников от результатов их деятельности или действий (причем работники, как правило, считаются однородными) и числа работников, нанимаемых в зависимости от состояния природы, которые максимизировали бы математическое ожидание целевой функции центра при условии, что всем принятым на работу гарантируется уровень полезности не меньший резервной заработной платы (при этом может добавляться условие обеспечения центром определенных гарантий для безработных). Отметим, что сформулированная задача существенно проще (так как не учитывается активность работников), чем базовая модель теории контрактов, в которой фигурирует дополнительное условие выбора АЭ действия, максимизирующего его ожидаемую полезность при заданной системе стимулирования [44]. В настоящей работе нас будут интересовать постановки задач формирования состава АС, учитывающие активность всех ее участников.
Несколько моделей, в которых определялось оптимальное с точки зрения информационной нагрузки на центр число АЭ, которых следует включать в АС, рассматривались в работе [36] при изучении факторов, определяющих эффективность управления многоуровневыми организационными системами. Интересным для настоящего исследования представляется приведенный в упомянутой работе пример.
160
Пример 17. Предположим, что задача стимулирования заключается в распределении между n однородными АЭ фонда заработной платы (ФЗП) R. Если функция затрат каждого АЭ есть с(у) = у2 / 2 b, а доход центра пропорционален сумме действий АЭ, то при постоянном фонде заработной платы зависимость эффективности стимулирования от числа АЭ имеет вид:
Ф*(п) = -JlbRn - R.
Содержательно, если выполнено предположение А.3. (в частности, существенно, что с'(0) = 0, а Н'(у) > 0), то центру выгодно задействовать как можно большее число АЭ, стимулируя их за выполнение сколь угодно малых действий потому, что в окрестности действия, минимизирующего затраты (у = 0), предельные затраты каждого АЭ минимальны. Следовательно, при фиксированном фонде заработной платы (максимум Ф (п) по R достигается при ФЗП, пропорциональном числу АЭ в АС: R* = Ь п / 2) центр заинтересован в неограниченном увеличении числа АЭ (напомним, что рассматривается случай, в котором центр не обязан гарантировать АЭ даже сколь угодно малую положительную полезность - см. также ниже).
Ситуация меняется, если управляющие возможности (возможности по переработке информации) центра ограничены. В большинстве работ (см. ссылки в [36]) используется следующая оценка числа связей между п подчиненными АЭ, контролируемыми одним центром: " 2п. Содержательно, эта оценка соответствует числу возможных коалиций, и, следовательно, связей между п АЭ.
Учтем информационные ограничения, умножив Ф (п) на показатель 2-^п, где X - 0, то есть: Ф(п) = (^2 fiRn - R) 2-Xn.
Максимум выражения Ф(п) по п достигается при п = nmax, где
R 1 Ц-^)2
= 8b У1! 1+XRln2/
Предположим теперь, что центр обязан гарантировать каждому АЭ, включенному в АС, некоторый минимальный уровень полезности U ?Ь / 2 (ограничение резервной заработной платы или ограничение пособия по безработице [9]). Тогда, решая задачу
161
определения оптимального размера вознаграждений АЭ при ограниченном ФЗП, получаем, что при постоянном фонде заработной платы зависимость эффективности стимулирования от числа АЭ имеет вид:
Ф*(п) = V2biR _ NU)П - R.
Максимум этого выражения достигается при п = п* = , то
2U
есть ограничение резервной заработной платы определяет оптимальный состав (в случае однородных АЭ - оптимальный размер) активной системы. •
Отметим, что, несмотря на то, что в [36] рассматривались многоэлементные (и многоуровневые) АС, взаимозависимость АЭ отсутствовала (как максимум, рассматривались АС со слабо связанными АЭ). В настоящей работе ниже рассматриваются задачи формирования состава АС при условии, что в общем случае АЭ сильно связаны (см. определения выше).
В экономике организаций принят следующий общий подход к определению оптимального размера организации (см. ссылки в [36]). С одной стороны, существует рынок - как система обмена прав собственности. С другой стороны, экономические агенты объединяются в организации, взаимодействующие на рынке. Объяснением существования экономических организаций служит необходимость компромисса между транзакционными издержками и организационными издержками.
К транзакционным издержкам относят:
- издержки вычленения, связанные с невозможностью точного определения индивидуального вклада элементов большой системы, то есть организация осуществляет агрегирование информации;
- информационные издержки: организация сокращает этот вид издержек путем сокращения объема перерабатываемой информации;
- издержки масштаба: в случае рынка институциональные ограничения требуют настолько высокого уровня детализации регламентирования деятельности, что последний неизбежно приводит к специализации в рамках организаций;
- издержки поведения: согласование интересов, наказание за отклонения и т.д. связаны с определенными затратами;
162
- издержки стабилизации, связанные с необходимостью координации в условиях невозможности эффективного прогнозирования будущего поведения системы, внешней среды и их взаимодействия.
Организационные издержки определяются "затратами на координацию" внутри организации, которые растут с увеличением ее размеров.
Транзакционные издержки препятствуют рынку заместить собой организацию, а организационные издержки препятствуют организации заместить собой рынок. Так как и первые, и последние зависят от размера организации и ее структуры, то, теоретически, должны существовать оптимальные параметры организации, при которых достигается уравновешивание упомянутых тенденций замещения.
Обширный класс исследований, детализирующих общий подход экономики организаций и посвященных определению оптимального (с точки зрения прибыли организации) числа работников, составляют работы по экономике труда (точнее - спросу на труд). Основная идея относительно определения оптимального числа нанимаемых работников, используемая в экономике труда и частично в настоящей работе ниже, заключается в следующем.
Количество дополнительной продукции (дохода) ЛН(п), которое получает фирма, нанимая одного дополнительного (сверх п уже работающих) работника (единицу труда), называется предельным продуктом труда74. Обычно считается ("закон уменьшения предельной отдачи" или "предельного дохода"), что предельный продукт труда убывает с ростом числа нанятых работников (то есть функция дохода центра вогнута). Содержательные интерпретации подобных предположений очевидны.
Предельные издержки Ло(п) есть затраты центра на стимулирование при приеме на работу п+1-го работника. Обычно считается ("закон возрастания предельных издержек"), что предельные издержки возрастают с ростом числа нанятых работников (то есть функция затрат центра на стимулирование выпукла). Содержательные интерпретации этого предположения также очевидны.
Условие максимизации прибыли (разности между доходом центра и его затратами на стимулирование) требует, чтобы прибыль была максимальна. Для этого следует75 изменять число занятых (увеличивать, если предельный доход превышает предельные издержки, и уменьшать в противном случае) до тех пор, пока предельный доход не будет равен предельным издержкам.
Закончив краткий обзор современного состояния исследований моделей формирования состава организационных систем, перейдем к анализу взаимосвязи задач стимулирования и задач формирования состава АС.
Введем следующие предположения, которые мы будем считать выполненным, если не будет оговорено особо, в ходе всего последующего изложения материала настоящего раздела.
А.10.1. Целевая функция центра H(yI) = ^ yi .
iel
А.10.2. А.3, V у,^. е функция с.(у) выпукла по у. е A., i е I.
В рамках предположения А.10.1 считается, что доход центра определяется суммой действий АЭ. В качестве обоснования можно привести следующее рассуждение.
Пусть функция дохода центра аддитивна, то есть
H(yI) = X Hi iVi), где H.iv.) - вогнутые функции. Тогда, делая iel
замену переменных, то есть переходя к H(yI) = X Vi, получим, что
iel
изменятся (оставаясь выпуклыми) функции затрат АЭ, что достаточно для условий существования (и единственности, если она обеспечивалась первоначально) максимума целевой функции центра. Другими словами, технологические связи между АЭ при "линеаризации" функции дохода центра учитываются в несепара- бельных функциях затрат АЭ.
Перейдем к рассмотрению задач формирования состава АС, последовательно усложняя рассматриваемые модели - от АС с сепарабельными затратами АЭ к АС с несепарабельными затратами АЭ.
Предположим, что затраты АЭ сепарабельны, то есть с. = с.(у.), i е I. Тогда эффективность оптимального управления составом I равна
(1) Ф(1) = max X ^Уг - с, (Уг)}.
У: еAi iel
Задача поиска оптимального состава АС при этом заключается в поиске I е Н, максимизирующего выражение (1) на множестве неотрицательных его значений.
Теорема 10.1. Если выполнены предположения А.10.1 и А.10.2, то оптимальным является максимальный состав АС, то есть I* = N.
Доказательство. Вычислим для каждого i е N оптимальное для
*
центра действие i-го АЭ: yi = aгg max {у^ - с^(у^)}. В силу
У, е Ai
предположений А.10.1 и А.10.2 для каждого АЭ такое действие
* *
единственно. Кроме того, очевидно, что Уг - Cj (Уг ) - 0, i е N.
Следовательно, каждое слагаемое в (1) неотрицательно. Так как дополнительных ограничений нет76, то максимум выражения (1) достигается при максимальном числе слагаемых. •
Содержательно результат теоремы 10.1 обусловлен тремя факторами, то есть тем, что: во-первых, в окрестности нулевого действия доход центра растет быстрее, чем затраты АЭ; во-вторых, центр имеет постоянный доход на масштаб производства (его функция дохода линейна, то есть не существует никаких технологических ограничений на число АЭ, осуществляющих совместную деятельность в рамках данной АС); и, наконец, в-третьих, АЭ получают в равновесии нулевую полезность (то есть они безразличны с точки зрения значения своей целевой функции между участием и неучастием в данной АС и входят в состав АС только в силу благожелательно отношения к центру - см. ГБ выше).
Для того чтобы исследовать класс моделей, в которых оптимален состав АС, отличный от максимального состава, рассмотрим последовательно модели, в которых присутствуют перечисленные выше три фактора.
Предположим, что центр должен гарантировать i-му АЭ, если он включен в АС, в равновесии минимальный уровень полезности77U. , и минимальный уровень полезности U. , если он не
'max 'min
включен в АС, U. > U; , i е N. При сепарабельных затратах
max min
АЭ минимальной системой стимулирования, реализующей дейст-
*
вие у , является следующая квазикомпенсаторная система стимулирования:
(2) у) = *> + у. = i е N.
I o^ Vi * Vi
Определим следующие величины:
(3) Ф* = max {Уг - с, iУг) - Ulnax }, i е N.
Уг eA, nax
При этом целевая функция центра имеет вид:
Ф(1)=хф; - xu-m^.
iel ieN\I
Следствие 10.1. Оптимален состав I* = {, е N | Ф- - -U- , }. Если Ф* = Ф(1*) = ХФ- - X U- . < 0, то ни один из соста-
iel * ieN\I *
вов не является допустимым.
Справедливость следствия 10.1 очевидна - в состав АС следует включать только те АЭ, доход от деятельности которых с учетом затрат на их стимулирование превышает затраты на выплату им компенсаций в случае исключения из состава АС. Если значение целевой функции центра Ф* на этом составе строго отрицательно, то это значит, что значения резервных заработных плат АЭ из набора N слишком велики по сравнению с тем эффектом, который приносит центру их участие в рассматриваемой АС1.
Пример 18. Пусть функции затрат АЭ имеют вид:
CiiVi) = у-2 /2гг. Тогда Ф(1) = Х{ - Uimax > - X Ulmin .
iel ieN \ I
Рассмотрим сначала случай однородных АЭ: г. = г,
Ulnax = Umax ^ Ulnin = Umin ^ * е N, Umin ? Umax . При этом
Ф(п) = п (г/2 - Umax + U^in ), п = 0,N .
Решение задачи Ф(п) ^ max имеет вид:
0 < п < N
N, г > 2Unax 0, г < 2U,
*
п = <
max

Рассмотрим теперь случай шести неоднородных АЭ, параметры которых приведены в таблице.
Параметр\ i
1
2
3
4
5
6
г,
12
10
8
6
4
2
Ui
max
4
4
3
1
2
2
Ui ,
min
1
1
1
1
1
1
Ф*
2
1
1
2
0
-1

Рассчитаем значения целевых функций центра при различных составах АС (понятно, что при одинаковых Uf . включать АЭ в
1 Следует напомнить, что в рассматриваемой модели центр в любом случае обязан выплатить АЭ из набора N как минимум следующую сумму:
X Ui .
min
ieN
167

АС следует в порядке убывания Ф,-):
Ф*({1}) = -3, Ф*({1}и{4}) = 0, Ф*({1}и{2}и{4}) = 2, Ф*({1}и{2}и{3}и{4}) = 4, Ф*({1}и{2}и{3}и{4}и{5}) = 5,
Ф*({1}и{2}и{3}и{4}и{5}и{6}) = 5. Таким образом, оптимальным является либо максимальный состав АС, либо включение первых пяти АЭ (в таблице шестой АЭ помечен серым цветом). При этом центр безразличен по отношению к включению или не включению в состав АС78 шестого АЭ так
* -
как для него имеет место Ф 6 = -U6 . - потери от его участия в
min
АС в точности равны той компенсации, которую центру пришлось бы выплачивать ему не включая в состав АС. Если бы Umjn, то центр был бы безразличен между включением и не включением в состав АС пятого АЭ и точно не включил бы шестой АЭ.
Предположим теперь, что "плата за участие в АС" {U,- }
понизилась и стала равна нулю, а величины { Uv } стали равны
min
трем единицам - см. таблицу.
Параметр\ i
1
2
3
4
5
6
г,
12
10
8
6
4
2
Ui
max
0
0
0
0
0
0
Ui ,
min
3
3
3
3
3
3
Ф*
6
5
4
3
2
1

Итак, Ф*({1}) = -9, Ф*({1}и{2}) = -1, Ф*({1}и{2}и{3}) = 6, Ф\{1}и{2}и{3}и{4}) = 12, Ф*({1}и{2}и{3}и{4}и{5}) = 17, Ф({1}и{2}и{3}и{4}и{5}и{6}) = 21. Теперь центру выгодно включать в состав АС все шесть АЭ. •
В рассмотренной выше модели учитывалась необходимость обеспечения участникам АС и АЭ, не входящим в ее состав, некоторого гарантированного уровня полезности. Перейдем к изучению моделей, в которых АЭ гарантируется нулевой уровень полезности (как и в моделях, описанных в первых девяти частях настоящей работы), но доход центра от привлечения дополнительных АЭ убывает (или растет медленнее, то есть предельный продукт труда убывает - см. выше) с ростом числа АЭ, уже вошедших в состав АС. Более конкретно, будем считать, что в п-элементной АС (n = |I|) функция дохода центра имеет вид
(4) Hiyl) = g(n) X Уг,
iel
где g(n) - убывающая функция числа АЭ в АС79.
Тогда, в рамках предположений А.10.1 и А.10.2, очевидно, существует оптимальный размер n* АС, который может быть определен методами, описываемыми ниже.
Содержательно, наличие в выражении (4) убывающей по n функции может объясняться необходимостью создания новых рабочих мест, ростом постоянных издержек и т.д. (см. закон убывающей предельной отдачи или убывающего предельного дохода выше).
Пусть АЭ однородны. Запишем целевую функцию центра в виде:
Ф*у, п) = п g(n) у - п с(у).
Вычислим оптимальное для центра реализуемое действие АЭ: у* = X(g(n)), где X() = с-1() - функция, обратная производной функции затрат. Подставляя в выражение для Ф(у, n) значение у = у* = X(g(n)), получим:
(5) Ф(п) = п g(n) X(g(n)) - п c(X(g(n))).
Вычислим производную выражения (5):
(6) 'ФФПП) = X(g(n)) [g(n) + п ^fl ] - c(X(g(n)).
dn dn
Если АЭ имеют функции затрат типа Кобба-Дугласа, то есть
c(y) = 1 ya г1-а, то приравнивая (6) нулю и проверяя знак второй a
производной, получаем, что максимизирующая целевую функцию центра зависимость g (п) должна удовлетворять следующему дифференциальному уравнению:
(7) g1/ia-1)(n) [ g(n) + п dgnnl ] = 0.
a dn
Решение уравнения (7) при условии g(1) = 1 есть (5) g*(n) = ni1-a)/a.
Таким образом, мы доказали справедливость следующего результата.
Теорема 10.2. Если АЭ имеют функции затрат типа Кобба- Дугласа, то при функциях g(n), всюду убывающих быстрее функции g (п), определяемой (8), оптимальным является минимальный состав АС (п = 1), при g(n), всюду убывающих медленнее g (п), оптимальным является максимальный состав АС (п = N), в остальных случаях может существовать промежуточный оптимальный размер АС.
Пример 19. Пусть функции затрат однородных АЭ имеют вид:
с.(уг) = уУ- /2г, то АЭ имеют функции затрат типа Кобба-Дугласа с
a = 2. Тогда Ф(у, п) = g(n) п у - п у2/2г. Вычисляя при фиксированном n максимум Ф(у, n) по у, получим:
Ф*(п) = max {g(n) п у - п у2/2г} = п g2(n) г / 2.
yeA
Вычисляя максимум Ф (п) по п, получаем дифференциальное
уравнение для функции g(n): g(n) + 2 п dg(n) = 0. Легко видеть,
dn
что оптимальная зависимость дохода центра от "масштабов производства" получается при g(n) ˜ 1/п (см. теорему 10.2). Если
170
функция g(n) всюду убывает медленнее, чем 1/п11^, то оптимальным является максимальный состав АС, если всюду убывает быстрее, чем 1/п11^, то оптимальным является минимальный состав АС, а в остальных случаях может существовать промежуточный оптимальный размер АС.
Подставляя в выражение для Ф (п) конкретную зависимость
g(n) = a / n, получаем, что максимум целевой функции центра
*
достигается при n = n = 1.
Если g(n) = 1 /п114, то п* = N, если g(n) = e - то п* = 1 /2 g,
если g(n) = , то п* = Ц- и т.д. •
1+gn2 V 3g
Рассмотрим теперь задачу формирования состава АС в случае, когда центр использует унифицированную пропорциональную систему стимулирования (см. оценки сравнительной эффективности и другие свойства пропорциональных систем стимулирования в шестом раздел выше) со ставкой оплаты Я < 180. Тогда в рамках предположений А.10.1 и А.10.2 действия, выбираемые АЭ, есть
у* = Хг(Я), где Xii^) = с;-1{) i е I.
Целевая функция центра, представляющая собой разность между линейным доходом (см. предположение А.10.1) и затратами на стимулирование, имеет при этом вид:
(9) Ф(У1) = (1 - Я) X Xi (Я).
iel
Легко видеть, что в рамках предположения А.10.2, X.i) - непрерывные возрастающие вогнутые функции, поэтому (9) также вогнутая функция. Следовательно, для каждого фиксированного состава АС I е ^ существует единственная оптимальная с точки зрения центра ставка оплаты Я (I). Другими словами, оптимальной будет следующая стратегия центра - либо включать в состав АС все АЭ, либо никого.
Для того, чтобы уйти от полученного тривиального решения предположим, что у каждого АЭ существует свой резервный уровень заработной платы Uj (отметим, что речь идет о резервной
заработной плате, а не соответствующей ей резервной полезности), то есть АЭ соглашается участвовать в АС, только если его вознаграждение превышает резервную полезность. Таким образом, условие участия z-го АЭ имеет вид:
(Ю) 1 Хг(1) ^ Ui, i е N.
Обозначим - решение уравнения 1 Xi(1) = Uj, i е N, относительно 1, и упорядочим АЭ в порядке возрастания 1i. Значение целевой функции центра при включении в АС первых k АЭ равно: к
(11) Ф(к) = (1 - 1k) SXi(1k), к = 1,N .
i=1
Решение задачи синтеза оптимального состава АС имеет вид:
I' = {1, 2, к'}, где
(12) к* = arg max Ф(к).
к=1, N
Пример 20. Пусть функции затрат АЭ имеют вид:
Ci(yi) = y2 /2ri, тогда Xi(1) = 1 ri, F(yi) = (1 - 1) 1 X ri . Минималь-
iel
ные ставки оплаты, за которые соответствующие АЭ согласятся участвовать в АС, равны: Ai = . . Если имеется всего пять АЭ -
\2ri
претендентов на участие в АС - с параметрами, приведенными в таблице, то к = 4, то есть оптимальным является состав АС, включающий первые (в упорядочении Я,) четыре АЭ. •
Параметр\ i
1
2
3
4
5
Г,
1
1
1
1
1
U,
0.6
0.7
0.75
0.8
0.9
li
0.77
0.84
0.87
0.89
0.95
F(i)
0.1746
0.2733
0.3481
0.3777
0.2434

172
Проведенный анализ задач формирования состава многоэлементных АС с сепарабельными затратами АЭ позволяет сделать вывод, что в этом классе моделей удается на основании имеющейся информации упорядочить АЭ, и решать задачу определения оптимальной комбинации АЭ на множестве N комбинаций, а не на множестве всех возможных 2N комбинаций.
Откажемся от предположения о сепарабельности затрат, введенного в разделе 10.1, оставив в силе предположения А.10.1 и А.10.2. Задача синтеза оптимального состава АС примет вид:
(13) I* = aгg max Ф(1),
I еК
где
(14) Ф(1) = max Х{Уг - с. iVi)},
У: eAi iel
при условии, что Ф(1*) - 0^.
Как отмечалось выше, при решении задачи (13) возникают две основные проблемы: высокая вычислительная сложность (большое число составов АС, для которых необходимо вычислять максимальные эффективности управления и сравнивать их между собой) и необходимость конструктивного определения затрат АЭ в зависимости от состава АС и действий всех АЭ, входящих в этот состав (напомним, что соответствующая зависимость для функции дохода центра вводится в предположении А.10.1).
Рассмотрим следующий пример, иллюстрирующий специфику сформулированной задачи (см. также примеры 4, 8 и др., приведенные выше).
Пример 21. Пусть АЭ однородны и имеют функции затрат
(|a| ? 1/п):
Уг + a XL^j
(15) Ci(yi) = ^ /eI, i е N.

Если центр должен гарантировать каждому АЭ уровень полезности U , то оптимальной является квазикомпенсаторная система
стимулирования (см. раздел 4), при использовании которой значение целевой функции центра равно:
(16) F(yi) = g(n) X y, - X Cj (yi) - n U,
iel iel
где g(n) - множитель, отвечающий за убывание дохода центра с ростом числа АЭ, включенных в состав АС. Определим действия
АЭ, наиболее выгодные для центра: у* = g^-)--. Тогда
(1 + а (- - 1))2
зависимость целевой функции центра от числа n АЭ, входящих в АС, имеет вид:
2 2
(17) Ф(п) = - g )r 2 - n U .
2(1 + а (n -1))2
Обсудим роль параметра а, входящего в функцию затрат АЭ и отвечающего за влияние действий других АЭ на затраты данного АЭ (см. также модели АС с несепарабельными функциями затрат АЭ - примеры 4, 8 и др.).
Во-первых, при а > 0 затраты каждого АЭ возрастают с ростом действий других АЭ, а при а ?0 - убывают. Содержательно этот факт может интерпретироваться следующим образом: в первом случае АЭ "мешают" друг другу (например, при ограниченных технологией возможностях производства), а во втором - "помогают" (например, происходит разделение труда и т.д.).
Во-вторых, функция (17) убывает по параметру а, то есть с его ростом при любом фиксированном составе доход центра убывает. Будем считать, что а < 0, тогда при g(n) = n˜ (см. теорему
r -
10.2) получаем, что Ф(П) = 2 - n U .
2(1 + а(n -1))2
Предполагая существование ненулевого внутреннего решения, получим, что оптимальный размер АС равен:
1/3
,., , 1 1 n = 1 - - - - аа
*
U
С уменьшением значения параметра81 а растет оптимальный
размер АС, с увеличением гарантированного уровня полезности U он убывает. •
В более общем случае можно рассмотреть два типа взаимовлияния АЭ82:
- с увеличением состава АС затраты каждого АЭ не возрастают: ^i е N, VI е "j е N1, "у е П Ai с,^:) - c,(yi^{j});
ieN
- с увеличением состава АС затраты каждого АЭ не убывают:
Vi е N, VI e i^, V j e N\I, V у e П A- Ci(yi) ?Ci(yiu{j}).
ieN
Содержательные интерпретации обоих случаев очевидны.
Таким образом, можно выделить три общих подхода к решению задач формирования состава АС на основании рассмотрения задач стимулирования. Первый подход заключается в "лобовом" рассмотрении всех возможных комбинаций потенциальных участников АС. Его достоинство - нахождение оптимального решения, недостаток - высокая вычислительная сложность. Второй подход основывается на методах локальной оптимизации [5] (перебора составов АС из некоторой окрестности определенного состава - см. постановки задач об оптимизации состава АС и приеме на работу выше). Используемые при этом эвристические методы в общем случае не дают оптимального решения и поэтому требуют оценивания их гарантированной эффективности. И, наконец, третий подход заключается в исключении заведомо неэффективных комбинаций АЭ на основании анализа специфики задачи стимулирования (см. упорядочение АЭ, имеющих сепарабельные затраты, в задачах формирования состава АС). При этом вычислительная сложность резко сокращается и удается получить точное (оптимальное) решение, но, к сожалению, данный подход применим далеко не всегда, и в каждом конкретном случае возможность его использования требует соответствующего обоснования.
ЗАКЛЮЧЕНИЕ
Таким образом, в настоящей работе в рамках единой постановки задачи управления (см. второй и третий разделы) представлены результаты систематического рассмотрения теоретико- игровых моделей механизмов функционирования многоэлементных организационных систем в предположении некооперативного поведения управляемых субъектов (активных элементов).
При исследовании этого класса моделей ключевую роль играют два принципа - принцип декомпозиции игры АЭ и принцип компенсации затрат.
Принцип компенсации затрат, заключающийся в том, что минимальная система стимулирования, реализующая в рамках гипотезы благожелательности любое действие АЭ, должна компенсировать его затраты, справедлив и для многоэлементных, и для одноэлементных АС, и использует метод анализа минимальных затрат на стимулирование.
Принцип декомпозиции игры АЭ специфичен для многоэлементных систем и заключается в использовании управления (системы стимулирования), которое делает доминантной стратегией, то есть стратегией, абсолютно оптимальной при любой обстановке игры (независимо от действий других АЭ), выбор каждым активным элементом наиболее выгодных для центра действий - см. формальные результаты о структуре оптимального решения задачи синтеза оптимальной системы стимулирования в четвертом разделе выше.
Предложенный подход и полученные в его рамках общие результаты позволяют исследовать специфические классы систем стимулирования (см. пятый и шестой разделы), обобщить результаты исследования детерминированных многоэлементных АС на случай систем с неопределенностью (седьмой раздел настоящей работы) и систем с глобальными ограничениями на множества допустимых состояний элементов (восьмой и девятый разделы), сформулировать и решить ряд задач формирования состава системы (десятый раздел).
Конечно, на сегодняшний день рано говорить о получении полной и завершенной картины всего многообразия механизмов
176
управления многоэлементными организационными системами. Тем не менее, приведенные результаты позволяют как выделить перспективные направления дальнейших исследований (в первую очередь - изучение механизмов управления организационными системами с кооперативным поведением участников, а также более полное исследование многоэлементных АС с неопределенностью и глобальными ограничениями на множества допустимых действий АЭ и получение простых алгоритмов решения задач формирования состава АС), так и обоснованно предположить, что обобщение существующих методов изучения сложных организационных систем окажется эффективным и адекватным новым задачам инструментом.
В заключение авторы считают своим приятным долгом выразить признательность рецензенту настоящей работы - д.т.н., проф. В.Н. Буркову и участникам постоянно действующего семинара по управлению активными системами - М.В. Губко, А.Б. Гурееву, Е.В. Колосовой, Н.В. Константиновой, Н.А. Коргину,
Т.Б. Кочиевой, С.Н. Петракову, С.А. Чижову, Т.Е. Шохиной и др., чья критика и ценные замечания способствовали пониманию специфики управления многоэлементными организационными системами.
177
ЛИТЕРАТУРА
1. Алиев В.С., Кононенко А.Ф. Об условиях точного агрегирования информации в теоретико-игровых моделях. М.: ВЦ РАН, 1991. - 28 с.
2. Алиев В.С., Кононенко А.Ф. Точное агрегирование в теоретико- игровых моделях. М.: ВЦ АН СССР, 1990. - 26 с.
3. Андреев С.П., Бурков В.Н., Динова Н.И., Кондратьев В.В., Константинова Н.В., Цветков А.В., Черкашин А.М. Механизмы функционирования организационных систем (обследование, описание и моделирование). Препринт. М.: Институт проблем управления, 1983.- 52 с.
4. Бурков В.Н. Основы математической теории активных систем. М.: Наука, 1977. - 255 с.
5. Бурков В.Н., Горгидзе И. А., Ловецкий С.Е. Прикладные задачи теории графов. Тбилиси: Мецниереба, 1974. - 234 с.
6. Бурков В.Н., Гуреев А.Б., Новиков Д.А. Эффективность ранговых систем стимулирования // Автоматика и Телемеханика. 2000. № 8.
7. Бурков В.Н., Перфильева Л.Г., Тихонов А.А. Модель динамики трудовых ресурсов / Механизмы функционирования организационных систем: теория и приложения. М.: ИПУ, 1982. С. 120 - 124.
8. Бурков В.Н., Еналеев А.К., Новиков Д.А. Вероятностная задача стимулирования // Автоматика и Телемеханика. 1993. N 12. С. 125 - 130.
9. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и Телемеханика. 1993. № 11. С. 3 - 30.
10. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функционирования социально-экономических систем с сообщением информации // Автоматика и Телемеханика. 1996. № 3. С. 3 - 25.
11. Бурков В.Н., Ланда Б.Д., Ловецкий С.Е., Тейман А.И., Чернышев В.Н. Сетевые модели и задачи управления. М.: Советское радио, 1967. - 144 с.
12. Бурков В.Н., Еналеев А.К., Кондратьев В.В., Цветков А.В. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. I. Необходимые и достаточные условия оптимальности правильных механизмов функционирования в случае полной информированности центра // Автоматика и телемеханика. 1983. № 10. C. 139 - 143.
13. Бурков В.Н., Еналеев А.К., Кондратьев В.В., Цветков А.В. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. II. Синтез оптимальных правильных механизмов в случае полной информированности центра // Автоматика и телемеханика. 1984. № 11. C. 86 - 92.
178
14. Бурков В.Н., Еналеев А.К., Кондратьев В.В., Цветков А.В. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. III. Некоторые задачи оптимального согласованного планирования в случае неполной информированности центра // Автоматика и телемеханика. 1984. № 12. C.. 94 - 100.
15. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. М.: Наука, I98I. - 384 с.
16. Бурков В.Н., Новиков Д.А. Введение в теорию активных систем. М.: ИПУ РАН, 1996. - 125 с.
17. Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: Синтег, 1997. - 188 с.
18. Бурков В.Н., Новиков Д.А. Механизмы критериального управления активными системами в задачах стимулирования / Сборник трудов ИПУ РАН. Том 10, 2000.
19. Бурков В.Н., Новиков Д.А. Модели и механизмы теории активных систем в управлении качеством подготовки специалистов. М.: ИЦ, 1998. - 158 с.
20. Бурков В.Н., Новиков Д.А. Оптимальные механизмы стимулирования в активной системе с вероятностной неопределенностью. Часть 2. // Автоматика и Телемеханика. 1995. № 10. С. 121 - 126.
21. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. М.: Синтег, 1999 - 128 с.
22. Вилкас Э.Й. Оптимальность в играх и решениях. М.: Наука, 1990. - 256 с.
23. Воропаев В.И. Управление проектами в России. М.: Аланс,1995.-225с.
24. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976. - 327 с.
25. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. М.: Радио и связь, 1982. - 144 с.
26. Джапаров Б.А., Кондратьев В.В., Цветков А.В., Шангитбаев Ж.К. Оптимальное согласованное управление процессом шихтоподготовки._ В кн.: Методы исследования сложных систем. Труды конференции молод^1х ученых. М.: ВНИИСИ, 1985. C.. 52 - 57.
27. Динова Н.И. Бригадные формы оплаты труда / Механизмы управления социально-экономическими системами. М.: ИПУ РАН, 1988. С. 79-82.
28. Динова Н.И., Щепкин А.В. Анализ принципов стимулирования неоднородных коллективов / Планирование, оценка деятельности и стимулирование в активных системах. М.: ИПУ РАН, 1985. С. 93 - 100.
179
29. Кондратьев В.В., Тихонов А.А., Цветков А.В. Частично согласованное планирование в условиях неполной информированности центра.- В кн.: Материал^! YIII Всесоюзного семинара-совещаниия: "Управление большими системами". Алма-Ата: Каз.ПТИ, 1983. C. 18 - 20.
30. Кононенко А.Ф., Халезов А.Д., Чумаков В.В. Принятие решений в условиях неопределенности. М.: ВЦ АН СССР, 1991. - 211 с.
31. Морозов А.И., Палюлис Н.К.-С., Цветков А.В. Анализ системы стимулирования тематического подразделения.- В кн.: Неопределенность, риск, динамика в организационных системах. М.: Институт проблем управления, 1984. C. 14 - 23.
32. Мулен Э. Кооперативное принятие решений: аксиомы и модели. М.: Мир, 1991. - 464 с.
33. Новиков Д.А. Механизмы гибкого планирования в активных системах с неопределенностью // Автоматика и Телемеханика. 1997. № 6. С. 3 - 26.
34. Новиков Д.А. Механизмы стимулирования в динамических и многоэлементных социально-экономических системах // Автоматика и Телемеханика. 1997. № 6. С. 3 - 26.
35. Новиков Д.А. Механизмы стимулирования в моделях активных систем с нечеткой неопределенностью. М.: ИПУ РАН, 1997. - 101 с.
36. Новиков Д.А. Механизмы функционирования многоуровневых организационных систем. М.: Фонд "Проблемы управления", 1999. - 150 с.
37. Новиков Д.А. Обобщенные решения задач стимулирования в активных системах. М.: ИПУ РАН, 1998. - 68 с.
38. Новиков Д.А. Оптимальность правильн^1х механизмов управления активными системами. Часть 1. Механизмы планирования // Автоматика и Телемеханика. 1997. № 2. С. 154 - 161.
39. Новиков Д.А. Оптимальность правильных механизмов управления активными системами. Часть 2. Механизмы стимулирования // Автоматика и Телемеханика. 1997. № 3. С. 161 - 167.
40. Новиков Д.А. Оптимальные механизмы стимулирования в активной системе с вероятностной неопределенностью. Часть 3. // Автоматика и Телемеханика. 1995. № 12. С. 118 - 123.
41. Новиков Д.А. Оптимальные механизмы стимулирования в активных системах с нечеткой внешней неопределенностью // Автоматика и Телемеханика. 1997. № 9. С. 200 - 203.
42. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: Синтег, 1999. - 108 с.
43. Новиков Д.А. Стимулирование в вероятностных активных системах: роль неопределенности // Автоматика и Телемеханика.1997.№8.С.168-177.
180
44. Новиков Д.А. Стимулирование в социально-экономических системах (базовые математические модели). М.: ИПУ РАН, 1998. - 216 с.
45. Оуэн Г. Теория игр. М.: Мир, 1971. - 230 с.
46. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.: Высшая школа, 1998. - 304 с.
47. Сандак Н.Н. Некоторые общесистемные и математические аспекты теории систем с соревнующимися элементами / Управление техническими и организационными системами с применением в^хчислительной техники. Труды XXIII конференции молод^1х учен^1х. М.: Наука, 1979. С. 160 - 171.
48. Уандыков Б.К. Методы согласованного планирования в активных производственных системах с зависимыми элементами / Диссертация на соискание ученой степени к.т.н. М.: ИПУ РАН, 1998.
49. Цветков А.В. Многокритериальная согласованная оптимизация при неопределенности в активных системах.- В кн.: Декомпозиция и координация в сложных системах. Тезисы докладов Всесоюзной научной конференции. Ч. II. Челябинск: Челябинский политехнический институт, 1986. C.103-104.
50. Цветков А.В. Модель механизма реализации целевой программы выполнения и перевыполнения плана в условиях неопределенности. - В кн.: Теоретические и прикладные задачи оптимизации. М.: Наука, 1985. C.60-65.
51. Цветков А.В. О выборе согласования в двухуровневой активной системе с неопределенностью.- В кн.: Планирование, оценка деятельности и стимулирование в активных системах. М.: Институт проблем управления, 1985. C. 30 - 34.
52. Цветков А.В. Свойства множеств согласованных управлений в случае нескольких целей согласования.- В кн.: Тезисы докладов X Всесоюзного совещания-семинара "Управление иерархическими активными системами". Тбилиси: Мецниереба, 1986. C. 49.
53. Цветков А.В. Согласованное планирование в задаче в^хполнения и перевыполнения плана в условиях неопределенности.- В кн.: Материал^! YIII Всесоюзного семинара-совещания: "Управление большими системами". Алма-Ата: Каз.ПТИ, 1983. C. 61 - 63.
54. Цветков А.В. Условия оптимальности согласованных механизмов функционирования при неопределенности.- В кн.: Неопределенность, риск, динамика в организационных системах. М.: Институт проблем управления, 1984. C. 73 - 81.
55. Цыганов В.В. Адаптивные механизмы в отраслевом управлении М.: Наука, 1991. - 166 с.
56. Fudenberg D., Tirole J. Game theory. Cambridge: MIT Press, 1995.-579 p.
181
57. Green J., Stockey N. A comparison of tournaments and contracts // Journal of Political Economy. 1983. Vol. 91. N 3. P. 349 - 364.
58. Grossman S., Hart O. An analysis of the principal-agent problem // Econometrica. 1983. Vol. 51. N 1. P. 7 - 45.
59. Hart O.D., Holmstrom B. Theory of contracts // Advances in economic theory. 5th World congress. Cambridge: Cambridge Univ.Press, 1987.P.71-155.
60. Hart O.D. Optimal labor contracts under asymmetric information: an introduction // Review of Economic Studies. 1983. Vol. 50. N 1. P. 3 - 35.
61. Itoh H. Incentives to help in multi-agent situations // Econometrica. 1991. Vol. 59. № 3. P. 611 - 636.
62. Lasear E., Rosen S. Rank-order tournaments as optimal labor contracts // Journal of Political Economy. 1981. Vol. 89. N 5. P. 841 - 864.
63. Ma C. Unique implementation of incentive contracts with many agents // Review of Economic Studies. 1988. Vol. 55. № 184. P. 555 - 572.
64. Malcomson J.M. Rank-order contracts for a principal with many agents // Review of Economic Studies. 1986. Vol. 53. N 5. P. 803 - 817.
65. Mookherjee D. Optimal incentive schemes with many agents // Review of Economic Studies. 1984. Vol. 51. № 2. P. 433 - 446.
66. Myerson R.B. Game theory: analysis of conflict. London: Harvard Univ. Press, 1991. - 568 p.
67. Myerson R.B. Optimal coordination mechanisms in generalized principal- agent problems // Journal of Mathematical Economy. 1982.Vol.10.№1.P.67-81.
182
сожалению, оказывается, что компенсаторные системы стимулирова
ния "неустойчивы" - сколь угодно малая ошибка в описании, например,
предпочтений АЭ приводит к конечному (и иногда значительному с
содержательной точки зрения) изменению реализуемого данной системой стимулирования действия АЭ. Тем не менее, умея решать задачу
стимулирования, можно строить так называемые обобщенные решения, обладающие максимальной гарантированной эффективностью в заданной области возможных значений параметров модели [37]. В упомянутой работе подробно обсуждаются методы построения обобщенных решений одноэлементных задач стимулирования. Можно предположить,
что предложенная методология применима и для многоэлементных задач, поэтому в настоящей работе детально исследовать проблему устойчивости решений мы не будем.
9
стимулирования с глобальными ограничениями на множества допустимых действий активных элементов, то есть модели, в которых ГНП не выполнена. Результаты же первых семи разделов существенно используют предположение о возможности независимого выбора состояний элементами.
1 Очевидно, что модель S1 является частн^тм случаем модели S2, модель S3 - частн^тм случаем модели S4 и т.д. Тем не менее, в методических целях все модели рассматриваются одинаково подробно. 22
1 Для моделей S7 и S8 чрезвычайно важна информированность центра о действиях АЭ и результатах деятельности АС. Так, если все действия АЭ полностью наблюдаются центром, то информация о результате деятельности АС избыточна (получаем модель S3 или S4) и т.д. (см. подробное обсуждение в разделе 4.7).
стимулирования, оптимальной в модели S1.
43
2 Следует признать, что данная модель представляется достаточно экзотической с содержательной точки зрения, однако полностью исключать возможность косвенной зависимости дохода центра от действий АЭ нельзя. Например, доход центра от действий АЭ может быть получен в следующем периоде, когда станут известными значения их действий, а стимулирование должно выплачиваться в текущем периоде на основании наблюдаемого агрегированного результата деятельности.
51
2 Если после выбора АЭ действия центру становится известным истинное значение параметра функции затрат АЭ, то возможно использование механизмов гибкого планирования [4, 33], в которых вознаграждение АЭ параметрически зависит от г.
100
2 Несколько забегая вперед, сделаем следующее качественное замечание: к "функциям затрат" (1) ниже будет применена теорема 4.4.1, что совместно с условиями согласованности соответствующих четких и нечетких функций затрат АЭ позволит доказать S-оптимальность системы стимулирования, компенсирующей затраты (1) (см. для сравнения выражения (4)-(6) в разделе 7.1.1). Другими словами, конструкция, типа выражения (1), является результатом совместного применения определения согласованности и принципа МГР.
107
обзоры [9, 10, 34]).
2 Если допустить возможность закупки сырья и продажи продукции .-^гм АЭ либо только на рынке по ценам с^гг и bit^, либо в АС, то условие участие 150 данного АЭ в производственной цепочке примет вид: а, ? агг, bi > Ьгг. Рассмотрение моделей, в которых возможна закупка части сырья (и/или продажа части продукции) на рынке, выходит за рамки настоящей работы.
151
рования, реализующей заданное действие, а этап планирования, то есть выбора оптимального реализуемого действия, как правило, не вызывал значительных трудностей. Поэтому (21) является одним из немногих случаев, когда основную трудность составляет именно решение задачи оптимального согласованного планирования.
1 Отметим, что в рассматриваемом примере при а > 0 оптимальный 174
размер АС не превышает единицы.
1 "Квази"-система стимулирования некоторого типа (К-типа, С-типа, L-типа и т.д.) отличается от просто системы стимулирования данного типа тем, что она отлична от нуля только при действии АЭ, равном реализуемому действию [42, 44].
2 Отдельного обсуждения заслуживает вопрос об устойчивости оптимального решения по параметрам теоретико-игровой модели [24]. К
3 Приравнивая стимулирование затратам и предполагая, что минимальные затраты (и минимальное стимулирование) равны нулю, мы считаем, что центр должен обеспечить АЭ как минимум ненулевую полезность - условие индивидуальной рациональности АЭ. Как показано в [44], большинство результатов (по крайней мере, вся методика анализа) остаются в силе в случае, если минимальная гарантированная полезность АЭ строго положительна (содержательна она может интерпретироваться как резервная заработная плата АЭ - полезность, которая может быть им получена вне рассматриваемой активной системы [9]), поэтому 10
4 Пока предполагается, что множества допустимых действий отдельных АЭ независимы (так называемая гипотеза независимого поведения (ГНП)), ниже в восьмом разделе будет рассмотрен случай зависимых множеств допустимых действий АЭ.
13
6 В настоящей работе принята независимая нумерация формул внутри каждого подраздела. 14
7 Данное предположение (о некооперативном характере взаимодействия активных элементов) чрезвычайно важно для всего последующего изложения. Допущение наличия коалиционных эффектов с одной стороны привело бы к необходимости соответствующего определения решения игры, а с другой стороны, несомненно, расширило бы как содержательные интерпретации, так и области возможных приложений рассматриваемых формальных моделей. Тем не менее, в настоящей работе мы ограничимся концепцией равновесия Нэша.
15
8 В восьмом разделе настоящей работы рассматривается ряд моделей
17
9 В целом, для теории активных систем и большинства других разделов теории управления, изучающих задачи стимулирования, на сегодняшний день характерно исследование именно некооперативных моделей взаимодействия участников АС (исключениями являются [7, 24, 32, 36]). 18
10 Основанием классификации оснований вводимой системы классификаций служит набор параметров, который однозначно описывает большинство моделей многоэлементных АС.
19
11 В работе [21] системы стимулирования, в которых на различных подмножествах множества допустимых действий АЭ используются различные базовые системы стимулирования, было предложено называть составн^гми и обозначать последовательной записью их компонент. Соответственно, системы стимулирования, являющиеся алгебраической суммой базовых, было предложено называть суммарными и обозначать суммой их компонент.
12 Учитывая третье основание классификации, получим шестнадцать классов (с учетом унификации) и т.д., то есть, дополняя систему классификаций нов^гми основаниями (и следя за выполнением требований полноты и непротиворечивости), можно породить еще большее число более узких классов моделей. Кроме того, следует отметить, что мы считаем, что параметры системы стимулирования и всех АЭ характеризуются одним и тем же значением признака классификации по тому или иному основанию. Например, если затраты сепарабельны, то они сепарабельны у всех АЭ. В общем случае (отказываясь от этого предпо-
21
13 Отметим, что при анализе эффективности персонифицированных и унифицированных систем стимулирования мы не учитываем информационную нагрузку на управляющий орган, в отличие от, например, [36].
24
14 Напомним, что гипотеза благожелательности подразумевает, что из множества решений игры (множества реализуемых действий, то есть действий, доставляющих при заданной системе стимулирования максимум целевой функции АЭ) АЭ выберет действие, наиболее благоприятное для центра. 26
15 Напомним, что e-оптимальной называется система стимулирования,
эффективность К(о) которой удовлетворяет: К(о) > max К(о) - е.
о е M
27
16 В настоящей работе принята сквозная нумерация примеров.
28
18 Символ "•" здесь и далее обозначает окончание примера, доказательства и т.д.
19 Если центр ограничен использованием определенных классов систем стимулирования, то все приведенные рассуждения остаются в силе с учетом того, что индивидуальные минимальные затраты на стимулиро-
29
вание необходимо определять с учетом ограничений, наложенных на механизм стимулирования. 30
20 Система стимулирования (1а) является системой коллективного стимулирования, так как размер вознаграждения каждого АЭ зависит как от его собственных действий, так и от действий других АЭ.
31
21 Нумерация лемм, теорем и т.д. независимая внутри каждого раздела и включает его номер.
22 В условии (2) можно использовать нестрогое неравенство, одновременно требуя строгой положительности 5. Точно так же в пункте в) можно ослабить требование строгой положительности 5i, но рассматривать (3) как строгое неравенство.
33
1 Напомним, что в силу предположений А.3 и А.4 центр должен обеспечить АЭ неотрицательную полезность (условие индивидуальной рациональности гласит, что АЭ всегда имеет возможность выбрать нулевое действие, которое даже при нулевом вознаграждении обеспечивает ему нулевую полезность). 36
24 Отметим, что множество Arg max {H(y) - Jmin(y)} может содер-
уе Л'
жать более одной точки, однако для каждой из них можно построить систему индивидуального стимулирования, в том числе и для той, по которой определяется эффективность (или гарантированная эффективность) исходной системы коллективного стимулирования.
41
25 В противном случае АЭ всегда имеет возможность выбрать нулевое действие, требующее нулевых затрат.
26 Отметим, что (12) с учетом (10) является системой индивидуального
27 Все результаты настоящего и следующего разделов останутся в силе, если предположить, что Q: Л' (r) ^ m - однозначное непрерывное отображение, где 1 < m < n (при m > n смысл агрегирования теряется - см. также обобщения в разделе 4.7). 50
28 В теории иерархических игр модели агрегирования исследовались в работах [1, 2].
29 Для того чтобы исключить выбор АЭ нулевых действий при использовании унифицированных систем стимулирования в модели S5 следует доплачивать за выбор ненулевых действий строго положительную величину не всем АЭ, а только активным элементам, принадлежащим
множеству Arg max i^I
54
30 См. четыре варианта в разделе 4.5.
59
31 Напомним, что в теоремах 4.5.1 и 4.6.1 фигурировал произвольный вектор у (z) из множества Y (z).
32 Отметим, что если функция дохода центра зависит только от агрегированного результата деятельности, то K4 переходит в K2. Более того, если функции затрат сепарабельны, то в (4) можно вместо min H(y)
yeY *( z)
использовать H(y*), где у* = arg max H(y).
уeY*(z)
33 Такая ситуация может рассматриваться как частный случай стимулирования, зависящего от результата деятельности АС в целом - оператор Q(-) может быть взаимно однозначен по наблюдаем^тм действиям АЭ.
63
34 Отметим, что система стимулирования (5) аналогична системе стимулирования, оптимальной в модели S5, а (6) - системе стимулирования, оптимальной в модели S4.
65
35 Материал данного раздела в основном основывается на развернутой версии работы [6].
67
36 Напомним, что компенсаторная (К-типа) и квазикомпенсаторная (QK- типа) системы стимулирования оптимальны, то есть имеют максимальную эффективность. Поэтому имеет смысл сравнивать эффективность исследуемой системы стимулирования с эффективностью именно этих систем стимулирования .
71
37 Если попытаться перенести описанную систему классификаций на многоэлементные АС с неопределенностью, то следует помнить, что в общем случае каждый их участников АС может обладать различной информированностью, то есть в многоэлементных АС в общем случае
91
38 Принцип соответствия может быть сформулирован и для задач стимулирования в многоэлементных АС. Например, если в модели S4 предположить, что затраты сепарабельны, то все результаты должны перейти в соответствующие результаты, полученные для модели S3. Далее, если в модели S3 предположить, что стимулирование каждого АЭ зависит только от его собственных действий, то все результаты должны перейти в соответствующие результаты, полученные для модели S1. Отметим, что для моделей S1-S8, описанных в четвертом разделе настоящей работы, принцип соответствия имеет место. 96
39 Как отмечается в [16], в АС с асимметричной информированностью одним из эффективных способов снижения неопределенности является сообщение информации от более информированных участников менее информированным (то есть от АЭ - центру). При этом возникают задачи построения неманипулируемых механизмов (в которых АЭ выгодно сообщать достоверную информацию) и др., заслуживающие отдельного исследования и выходящие за рамки настоящей работы.
40 Отметим, что при определении равновесия Нэша в случае внутренней интервальной неопределенности (см. выражение (1) в разделе 7.1.1) знание каждым АЭ истинных значений параметров функций затрат других АЭ б^гло "не очень" существенно, так как использованием системы стимулирования (4) центр декомпозировал игру АЭ. В случае вероятностной неопределенности предположения о знании или незнании 1-^1м АЭ вектора г.i становится существенн^гм.
105
41 Качественное этот эффект можно объяснить следующим образом: имеющаяся у центра информация о вероятностном распределении не позволяет "разумно" согласовать его информированность с информированностью АЭ (равновесием Нэша). 106
42 Введенное определение согласованности представляется вполне естественным и легко интерпретируемым: имеющаяся у центра нечеткая информация не должна противоречить реальным значениям параметров функций затрат АЭ.
43 То есть будем считать, что на момент принятия решений (выбора действия при известной функции стимулирования) i-ый АЭ знает истинное значение параметра г, и центр также на момент принятия решений (то есть на момент выбора функции стимулирования) знает его, то есть имеет достоверную информацию. 110
44 Ненаблюдаемость для центра действий АЭ объясняет то, что их вознаграждение зависит от наблюдаемого результат деятельности. Если бы действия АЭ б^гли наблюдаемы, то центр мог бы основывать стимулирование на выбираемых АЭ действиях и "забыть" о неопределенности", то есть задача свелась бы к детерминированной задаче стимулирования, которая подробно описана выше.
45 Следует отметить, что рассматриваемая модель является обобщением известной одноэлементной модели стимулирования в условиях неопределенности, подробно описанной в работах [8,20, 35-44, 54] (см. также
111
46 Если функция дохода центра (и/или функции затрат АЭ) зависит от результатов деятельности, то, устраняя неопределенность, можно перейти к соответствующим функциям, зависящим от действий АЭ (см. подробности в [9, 42, 44]). При этом если функции затрат АЭ зависят от результатов деятельности других АЭ, которые в свою очередь зависят от действий всех АЭ, то при определении равновесия Нэша (см. выражение (4) ниже) существенным становится наблюдаемость каждым активн^гм элементом действий всех АЭ. 112
47 По аналогии с результатами, полученными для модели S2, можно потребовать строгой положительности констант 5i, тем самым обеспечить единственность равновесия Нэша, перейти к индивидуальному стимулированию и т.д. (см. разделы 4.2 и 4.4).
115
48 Решение широкого класса задач теории контрактов, использующее идею определения множеств действий АЭ, которые в условиях вероятностной неопределенности могут приводить к наблюдаемым результатам деятельности, приведено в находящейся в печати статье А.Д. Халезова "Общее решение дискретной задачи центр-агент с симметричной информацией в условиях риска".
49 Для теории активных систем характерно стремление к поиску именно аналитических решений, позволяющих исследовать зависимость оптимального решения от параметров модели АС (общие результаты о структуре оптимального решения, конечно, также представляют теоретический интерес, однако их использование на практике затруднительно хотя бы в силу высокой вычислительной сложности соответствующих алгоритмов) [21, 44].
116
50 Данное предположение частично декомпозирует игру АЭ - результат деятельности каждого из них зависит уже только от его собственных действий и состояния природы (но не зависит от действий других АЭ), в то время как другие переменные - стимулирование и затраты - по- прежнему зависят, соответственно, от результатов деятельности и действий всех АЭ.
117
51 По аналогии с тем, как это делалось в теореме 4.2.1, можно в выражение (4) добавить константы {5}, обеспечивающие единственность равновесия Нэша, или наложить дополнительные ограничения (см. пункты а)-в) в теореме 4.2.1), обеспечивающие существование РДС (при условии, что АЭ использует МГР) и т.д.
52 Если предположение центра, что АЭ используют МГР не оправдывается, то результат теоремы 7.2.1 не имеет места (см. для сравнения анализ влияния неопределенности в разделе 7.1.1).
120
53 Напомним, что "E" обозначает оператор вычисления математического ожидания.
121
54 Очевидно, что, если затраты АЭ непрерывны, и центр использует компенсаторную систему стимулирования, то целевая функция АЭ полунепрерывна сверху.
123
55 Возможность и целесообразность обмена информацией (информационное расширение игры) в играх с запрещенн^гми ситуациями рассматривалась в работе [24].
56 В общем случае нельзя исключать из рассмотрения следующие ситуации: $ i е I, $е A.j: Ai(y.^=0.
127
57 Таким образом, "независимость" АЭ отражает свойства множеств их допустимых стратегий, а "связанность" - зависимость целевой функции АЭ от действий других игроков или наличие общих ограничений на управление. 130
58 Мы не будем останавливаться подробно на таких простых утверждениях, следующих из анализа выражений (1)-(3), как то, что с расширением множеств AM (то есть с ростом возможностей центра по управлению) и (ослаблением внешних - глобальных - ограничений) эффективность стимулирования не уменьшается и т.д.
131
59 Отметим, что в работе [24] при описании игр с запрещенными ситуациями взаимозависимость АЭ отражалась следующим образом: целевая
ф ¦ АЭ JWi (У)• Уе AГ А Лгл
функция 1-го АЭ определялась как: ffy) = < , где A^ с
у ^ Aj'^
A', i е I. Если V i е I Aj^ = то имеет место случай одинаковых
ограничений. В дальнейшем мы по умолчанию ограничимся случаем одинаковых ограничений.
133
гл
60 Задачи управления АС с переменными множествами допустимых действий рассматривались как в теории активных систем [4, 15, 55], так и в теории иерархических игр [24, 25, 30], причем, в основном, для динамических моделей.
135
61 В теории активных систем производственные цепочки с линейн^гми технологическими связями АЭ рассматривались в работах [15, 17,26,
45].
139
62 Если производственные возможности АЭ ограничены (см., например, модель производственной цепочки в [48]), то эти ограничения могут быть учтены соответствующей модификацией функций затрат АЭ. 142
63 Напомним, что в задаче стимулирования первого рода целевая функция центра не зависит явным образом от стимулирования (затраты центра на стимулирование не вычитаются из дохода центра) и совпадает с его функцией дохода.
143
64 В общем случае учет времени и технологических связей между АЭ производится в рамках сетевого планирования и управления (СПУ) [5, 11], широко используемого в управлении проектами [16, 23]. Задачи стимулирования в моделях СПУ практически не исследовались (исключения - [11, 16, 48]). Приводимое ниже рассмотрение влияние стимулирования на временные характеристики производственных цепочек является обобщением результатов, полученных в [48], и ни в коей мере не претендует на полноту исследования задач стимулирования в СПУ. 146
65 В общем случае в правых частях неравенств (14) могут фигурировать неотрицательные уровни полезности, которые требуется гарантировать соответствующим АЭ для участия в рассматриваемой АС.
66 С расширением множества допустимых состояний АС, очевидно, не уменьшается эффективность управления и значения других целевых
функционалов, максимизируемых на этом множестве. 152
68 Интересно отметить, что в большинстве исследованных задач стимулирования основную проблему составляло нахождение системы стимули-
155
69 Содержательно подобное предположение может отражать требование комплектности, то есть невозможности взаимозамены компонентов, используемых при данной технологии.
70 В общем случае данный алгоритм не гарантирует нахождения оптимального решения.
156
71 Мы надеемся, что использование одного и того же символа для обозначения множества потенциальных участников АС и их числа не приведет к путанице.
72 Затраты АЭ в общем случае несепарабельны.
157
73 Несмотря на внешнюю схожесть, задача (4) не является канонической задачей о назначении [5]. Напомним, что в задаче о назначении известен эффект деятельности каждого претендента на каждой должности. В нашем случае распределение должностей соответствовало бы фиксированному вектору действий (или конечному множеству возможных действий АЭ), но, фактически, при фиксированном составе АС производится выбор оптимальных векторов действий АЭ, вошедших в АС (см. выражение (3)).
159
74 Следует отметить, что предельный продукт любого индивида не является результатом только лишь его качеств, а зависит от числа уже нанятых работников, общего капитала фирмы, используемой технологии и т.д.
163
75 Если отказаться от экономической терминологии, то все станет несколько проще. В рамках введенных предположений целевая функция центра имеет единственный максимум по числу АЭ (как разность между вогнутой функцией дохода и выпуклой функцией затрат на стимулирование). Следовательно, для ее максимизации необходимо и достаточно обращения в ноль производной, что и соответствует равенству абсолютных значений производных слагаемых, то есть равенству предельного дохода и предельных издержек. 164
76 В ряде случаев максимальный состав АС оптимален, даже если существуют ограничения на ФЗП (см. пример 17).
165
77 "Условие участия" или "условие индивидуальной рациональности АЭ" гласит, что он согласится участвовать в данной АС, если ему в равновесии будет гарантированно обеспечен уровень полезности (или вознаграждение) не ниже заданного. 166
78 В подобных случаях, наверное, целесообразно принять гипотезу благожелательного отношения центра к АЭ - включение АЭ в состав АС (трудоустройство), даже при обеспечении ему нулевого уровня полезности, является важным мотивирующим фактором. 168
79 См. также модели многоуровневых АС в [36], для которых образом, подобн^гм (4), учитывались ограниченные возможности управляющих органов по переработке информации. Для того чтобы имел место закон убывания предельного дохода, относительно функции g(¦) обычно предполагают, что она убывает, причем скорость убывания такова, чтобы при не очень больших значениях п функция п g(n) возрастала (и б^тла, естественно, вогнутой).
169
80 Так как функция дохода центра прямо пропорциональна действиям АЭ, то использование ставок оплаты, больших единицы, приведет к отрицательным значениям целевой функции центра и ее убыванию по любым допустим^гм действиям АЭ.
171
81 Данное ограничение может не рассматриваться, если Ф(0) = 0 и 0 с
173
82 В данном случае учет взаимозависимости АЭ позволяет не использовать множитель g(n) для отражения убывающего и возрастающего дохода на масштаб.
175
??

??

??

??

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactor'


PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactor'


PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactor'


(9)


PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactor'



<<

стр. 2
(всего 2)

СОДЕРЖАНИЕ