стр. 1
(всего 6)

СОДЕРЖАНИЕ

>>

РОССИЙСКАЯ АКАДЕМИЯ НАУК
Институт проблем управления
им. В.А. Трапезникова



Д.А. Новиков, А.В. Цветков



МЕХАНИЗМЫ СТИМУЛИРОВАНИЯ
В МНОГОЭЛЕМЕНТНЫХ
ОРГАНИЗАЦИОННЫХ СИСТЕМАХ




Москва – 2000




PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
УДК 007
ББК 32.81
Н 73

Н 73 Новиков Д.А., Цветков А.В. Механизмы стиму-
лирования в многоэлементных организационных
системах. М.: ООО «НИЦ «Апостроф», 2000. –
182 с.
ISBN 5-94155-005-7

Настоящая работа содержит результаты исследований задач стиму-
лирования в двухуровневых организационных (активных) системах,
включающих несколько управляемых субъектов (активных элементов):
общую формулировку и классификацию задач стимулирования, решения
задач синтеза оптимальных функций стимулирования в детерминирован-
ных системах и системах с неопределенностью, анализ сравнительной
эффективности решений для различных моделей и зависимости свойств
этих решений от параметров модели управляемой системы.
Значительное внимание уделяется изучению практически важных ча-
стных случаев: унифицированных, компенсаторных, линейных и других
систем стимулирования, а также задачам управления организационными
системами с технологически связанными элементами и задачам формиро-
вания состава системы.


Утверждено к печати Редакционным советом Института

Рецензент: д.т.н., проф. В.Н. Бурков


УДК 007
ББК 32.81
Н 73

ISBN 5-94155-005-7

© Новиков Д.А., Цветков А.В., 2000


PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
СОДЕРЖАНИЕ

1. Введение…………………………………………………………….5

2. Общая постановка задачи стимулирования
в многоэлементных активных системах…………………………13

3. Классификация задач стимулирования
в многоэлементных активных системах…………………………19

4. Базовые системы стимулирования
в многоэлементных активных системах…………………….…...25
4.1. Модель S1: стимулирование АЭ зависит от его действия,
затраты сепарабельны………………………………………...25
4.2. Модель S2: стимулирование АЭ зависит от его действия,
затраты не сепарабельны……………………………………..31
4.3. Модель S3: стимулирование АЭ зависит от действий
всех АЭ, затраты сепарабельны……………………………...39
4.4. Модель S4: стимулирование АЭ зависит от действий
всех АЭ, затраты не сепарабельны…………………………..46
4.5. Модель S5: стимулирование АЭ зависит от результата
деятельности АС, затраты сепарабельны……………..…….50
4.6. Модель S6: стимулирование АЭ зависит от результата
деятельности АС, затраты не сепарабельны………………..56
4.7. Модели S7 и S8: стимулирование АЭ зависит от действий
всех АЭ и результата деятельности АС,
затраты сепарабельны или не сепарабельны………………..59

5. Ранговые системы стимулирования..…………………………….67
5.1. Нормативные ранговые системы стимулирования…………67
5.2. Соревновательные ранговые системы стимулирования…...78

6. Унифицированные пропорциональные
системы стимулирования................................................................86




3



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
7. Стимулирование в многоэлементных АС
с неопределенностью.......................................................................90
7.1. Внутренняя неопределенность…………………………….100
7.1.1. Интервальная неопределенность…………………...101
7.1.2. Вероятностная неопределенность………………….104
7.1.3. Нечеткая неопределенность………………………...106
7.2. Внешняя неопределенность…..……………………………110
7.2.1. Интервальная неопределенность…………………...117
7.2.2. Вероятностная неопределенность……………….…120
7.2.3. Нечеткая неопределенность………………………...122

8. Модели стимулирования с глобальными ограничениями
на множества допустимых действий АЭ…..……………….…..126

9. Производственные цепочки………….…………………….……138

10. Механизмы стимулирования
и задачи формирования состава активной системы…….……157

Заключение…………………………………………………….……176

Литература……………………………………………………..……178




4



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
1. ВВЕДЕНИЕ

Рассмотрим двухуровневую организационную (активную) сис-
тему веерного типа, состоящую из управляющего органа – центра –
на верхнем уровне иерархии и управляемых субъектов – активных
элементов на нижнем уровне. В работах [21, 42, 44] были предло-
жены следующие основания системы классификаций моделей
активных систем (см. рисунок 1): число активных элементов (одно-
элементные и многоэлементные системы), число периодов функ-
ционирования (статические и динамические системы), тип и вид
неопределенности (отсутствие неопределенности – детерминиро-
ванные системы; в зависимости от информации о неопределенных
параметрах – интервальные, вероятностные и нечеткие системы) и
др.
Исторически исследования задач стимулирования и в теории
активных систем (АС), и в других разделах теории управления
социально-экономическими системами (теория иерархических игр
[24, 25, 30], теория контрактов [57-60] и др.) начинались с изучения
так называемых базовых – детерминированных, одноэлементных
статических моделей (сектор I на рисунке 1), в которых помимо
управляющего органа – центра, присутствовал единственный
управляемый субъект – активный элемент (АЭ) [3, 4, 15].
Простейшим обобщением базовой одноэлементной модели яв-
ляется многоэлементная АС с независимыми (невзаимодействую-
щими) АЭ. В этом случае задача стимулирования распадается на
ряд одноэлементных задач [12-16]. Если ввести общие для всех или
ряда АЭ ограничения на механизм стимулирования, то получается
задача стимулирования в АС со слабо связанными элементами, в
которой решается набор параметрических одноэлементных задач
стимулирования, а проблема поиска оптимальных значений пара-
метров решается стандартными методами условной оптимизации
[20, 44].
Если активные элементы взаимосвязаны, то есть существуют
общие ограничения на множества допустимых состояний, планов,
действий, если результат деятельности одного АЭ зависит, помимо
его собственных действий, от действий других элементов, или если
стимулирование каждого АЭ зависит также и от результатов всех
5



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
остальных АЭ, то получается «полноценная» многоэлементная
задача стимулирования (сектор VII на Рис. 1), исследуемая в на-
стоящей работе.




IV V
III

II


I

АС
VI




VII


Рис. 1 Классификация задач стимулирования в АС
Общих подходов к аналитическому решению этого класса за-
дач на сегодняшний день, к сожалению, не существует и исследо-
ван он гораздо менее детально и систематически, чем базовая
модель (достаточно полный обзор современного состояния иссле-
дований задач стимулирования в многоэлементных и динамиче-
ских социально-экономических системах приведен в [34]). В боль-
шинстве случаев частные модели многоэлементных АС

6



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
основываются либо на непосредственном обобщении результатов
анализа базовой модели (в этом случае вычислительная сложность
катастрофически растет с увеличением числа АЭ), либо на рас-
смотрении параметрически заданных классов, поиск оптимального
решения в которых использует стандартную оптимизационную
технику [15, 16, 29, 31, 44].
Также расширениями базовой модели являются одноэлемент-
ные статические системы с неопределенностью (сектора II – IV на
Рис. 1) и детерминированные одноэлементные или многоэлемент-
ные динамические системы (сектор V на Рис. 1). В таблице 1 при-
ведены ссылки на работы, содержащие результаты исследований
соответствующих классов моделей I – VII. Отметим, что многоэле-
ментные или динамические системы с неопределенностью (им
соответствуют «пустые» сектора на Рис. 1) на сегодняшний день
практически не исследованы.
Таблица 1. Основные работы по моделям механизмов стимулирования в
активных системах

Модель Основные работы
(см. рис.1.)
I 4, 12, 15, 19, 24, 30, 36, 37, 44
II 10, 13-15, 30, 33, 38, 39, 46, 50-54, 67
III 8, 9, 40, 43, 44, 58-65
IV 35, 41, 42, 44
V 4, 15, 30, 34, 55
VI 15, 34, 55
VII 4, 15, 18, 26-29, 31, 34, 36, 54, 61, 63, 65,

Охарактеризуем кратко основные подходы, используемые при
решении одноэлементных задач (более подробное обсуждение,
снабженное детальными ссылками на соответствующую литерату-
ру, приводится ниже при классификации и исследовании много-
элементных АС).
В одноэлементной активной системе стратегией центра, де-
лающего первый ход, является выбор системы стимулирования, то
есть зависимости вознаграждения (или штрафов) АЭ за результаты
его деятельности. Стратегией активного элемента является выбор
7



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
(при известной функции стимулирования) действия, определяюще-
го (в детерминированных АС – однозначно, в АС с неопределенно-
стью – влияющего совместно с неопределенными факторами –
состоянием природы) результат деятельности.
В теории активных систем обычно предполагается, что инте-
ресы участников выражены их целевыми функциями (целевая
функция центра – разность между доходом от деятельности АЭ и
стимулированием последнего, целевая функция АЭ – разность
между стимулированием за выбор тех или иных действий и затра-
тами по выбору этих действий), поэтому в рамках теоретико-
игровых моделей рациональным считается поведение игроков,
заключающееся в максимизации целевых функции с учетом всей
имеющейся на момент принятия решений информации. Задача
стимулирования заключается в поиске таких систем стимулирова-
ния, которые максимизировали бы целевую функцию центра при
условии, что выбираемое активным элементом действие максими-
зирует целевую функцию элемента при этой системе стимулирова-
ния.
Ключевыми понятиями в базовых (детерминированных, одно-
элементных, статических) задачах стимулирования являются поня-
тия множества реализуемых действий и минимальных затрат на
стимулирование. При заданной системе стимулирования множест-
вом реализуемых действий является множество действий АЭ,
выбор которых максимизирует значение его целевой функции.
Если выполнена гипотеза благожелательности (ГБ – при прочих
равных АЭ выбирает наиболее благоприятное для центра дейст-
вие), то, очевидно, максимальную эффективность будут иметь
классы систем стимулирования, для которых объединение мно-
жеств реализуемых действий максимально [15, 42].
Альтернативным подходом является использование мини-
мальных затрат центра на стимулирование по реализации заданно-
го действия, которые равны значению функции стимулирования на
этом действии при условии, что данная система стимулирования
реализует это действие. Понятно, что системы стимулирования,
реализующие действия с меньшими затратами на стимулирование,
имеют более высокую эффективность [42, 44].


8



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Таким образом, решение задачи синтеза оптимальной функции
стимулирования в одноэлементной АС может быть сведено к
анализу соответствующих множеств реализуемых действий и/или
минимальных затрат на стимулирование [44]. При этом оказывает-
ся, что максимальную эффективность имеют так называемые
компенсаторные иди квазикомпенсаторные1 системы стимулиро-
вания (К-типа), которые компенсируют в определенном диапазоне
(определяемым ограничениями на размер вознаграждения АЭ)
активному элементу изменения затрат (или дохода), делая его
целевую функцию постоянной в этом диапазоне [15, 44]. Как будет
видно из дальнейшего изложения, идея компенсации затрат оказы-
вается чрезвычайно плодотворной при решении задач стимулиро-
вания и в многоэлементных АС2.
Таким образом, основной вывод из результатов исследования
задач стимулирования в одноэлементных АС, который будет
обобщен в настоящей работе на случай многоэлементных АС,
заключается в том, что минимальные затраты центра на стимули-
рование по реализации некоторого действия АЭ достигаются при
использовании компенсаторной или квазикомпенсаторной системы

1
«Квази»-система стимулирования некоторого типа (К-типа, С-типа,
L-типа и т.д.) отличается от просто системы стимулирования данного
типа тем, что она отлична от нуля только при действии АЭ, равном
реализуемому действию [42, 44].
2
Отдельного обсуждения заслуживает вопрос об устойчивости опти-
мального решения по параметрам теоретико-игровой модели [24]. К
сожалению, оказывается, что компенсаторные системы стимулирова-
ния «неустойчивы» – сколь угодно малая ошибка в описании, например,
предпочтений АЭ приводит к конечному (и иногда значительному с
содержательной точки зрения) изменению реализуемого данной систе-
мой стимулирования действия АЭ. Тем не менее, умея решать задачу
стимулирования, можно строить так называемые обобщенные решения,
обладающие максимальной гарантированной эффективностью в задан-
ной области возможных значений параметров модели [37]. В упомяну-
той работе подробно обсуждаются методы построения обобщенных
решений одноэлементных задач стимулирования. Можно предположить,
что предложенная методология применима и для многоэлементных
задач, поэтому в настоящей работе детально исследовать проблему
устойчивости решений мы не будем.
9



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
стимулирования. При этом затраты центра на стимулирование в
точности равны затратам АЭ по выбору этого действия, поэтому
при решении задач планирования, определения минимальных
ограничений на систему стимулирования и т.д., достаточно целе-
вую функцию центра рассматривать как разность его функции
дохода и функции затрат АЭ [44].
Последовательность решения и одноэлементных, и многоэле-
ментных задач имеет много общего. Сначала необходимо постро-
ить компенсаторную систему стимулирования, реализующую
некоторое (произвольное, или допустимое при заданных ограниче-
ниях) действие – первый этап – этап анализа согласованности
стимулирования. В одноэлементных АС в рамках гипотезы благо-
желательности для этого достаточно проверить, что при этом
максимум целевой функции АЭ будет достигаться, в том числе и
на реализуемом действии. В многоэлементных АС достаточно
показать, что выбор соответствующего действия является равно-
весной стратегией в игре активных элементов при заданной систе-
ме стимулирования. Если равновесий несколько, необходимо
ввести и проверить выполнение для рассматриваемого действия
дополнительной гипотезы о рациональном выборе элементов. В
большинстве случаев достаточным оказывается введение аксиомы
единогласия (АЭ не будут выбирать равновесия, доминируемые по
Парето другими равновесиями), иногда центру приходится вычис-
лять гарантированный результат по множеству равновесных стра-
тегий элементов и т.д. (см. ниже более подробно).
Далее следует приравнять стимулирование затратам1 и решить
стандартную оптимизационную задачу – какое из реализуемых


1
Приравнивая стимулирование затратам и предполагая, что минималь-
ные затраты (и минимальное стимулирование) равны нулю, мы считаем,
что центр должен обеспечить АЭ как минимум ненулевую полезность –
условие индивидуальной рациональности АЭ. Как показано в [44], боль-
шинство результатов (по крайней мере, вся методика анализа) остают-
ся в силе в случае, если минимальная гарантированная полезность АЭ
строго положительна (содержательна она может интерпретироваться
как резервная заработная плата АЭ – полезность, которая может быть
им получена вне рассматриваемой активной системы [9]), поэтому
10



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
действий следует реализовывать центру – второй этап – этап согла-
сованного планирования [6-9, 15, 16, 51-54, 58].
Помимо компенсаторных систем стимулирования, как на
практике, так и в теоретико-игровых моделях широко распростра-
нены другие системы стимулирования, также называемые базовы-
ми системами стимулирования. Среди них: скачкообразная система
стимулирования (С-типа), при использовании которой АЭ в зави-
симости от величины своих действий либо поощряется на фикси-
рованную величину, либо не поощряется вообще; пропорциональ-
ная система стимулирования (линейная – L-типа), в которой
величина вознаграждения прямо пропорциональна действию АЭ;
системы стимулирования D-типа (основанные на участии АЭ в
доходе или прибыли от деятельности АС в целом) и др. [21, 36, 42,
44].
Перечисленные системы стимулирования являются базовыми
для одноэлементных АС, составляя основу «конструктора», позво-
ляющего моделировать практически любую из используемых на
практике систем индивидуального стимулирования. Некоторые из
них не являются оптимальными (в смысле максимального значения
целевой функции центра, которое достигается в частности при
использовании компенсаторных систем стимулирования), поэтому
при изучении как одноэлементных, так и многоэлементных моде-
лей приходится исследовать их сравнительную эффективность.
Изложение материала настоящей работы имеет следующую
структуру. Во втором разделе приводится общая постановка задачи
стимулирования в многоэлементной АС, в третьем разделе вводит-
ся система классификаций задач такого рода и выделяются «базо-
вые» для многоэлементных АС модели: S1 – S8. Четвертый раздел
полностью посвящен исследованию этих восьми моделей и, в
частности – изучению сравнительной эффективности базовых
систем стимулирования, набор которых подробно описан в [21, 44].
В пятом и шестом разделах рассматриваются практически важные
частные случаи механизмов стимулирования: ранговые системы
стимулирования, унифицированные системы стимулирования и др.
Седьмой раздел посвящен систематическому исследованию задач

используемая в настоящей работе трактовка индивидуальной рацио-
нальности представляется вполне обоснованной.
11



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
стимулирования с многоэлементных АС, функционирующих в
условиях неопределенности (внешней и внутренней, интервальной,
вероятностной и нечеткой). В восьмом разделе рассматриваются
модели стимулирования с глобальными ограничениями на множе-
ства допустимых действий АЭ. Полученные при этом исследова-
нии теоретические результаты применяются в девятом разделе при
описании практически важного частного случая взаимозависимо-
сти АЭ – производственных цепочек. И, наконец, в десятом разде-
ле результаты решения задач стимулирования используются для
решения задач формирования состава многоэлементных АС. За-
ключение содержит качественное обсуждение основных результа-
тов и перспективных направлений дальнейших исследований.




12



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
2. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ СТИМУЛИРОВАНИЯ В
МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Рассмотрим многоэлементную детерминированную двухуров-
невую активную систему, состоящую из центра и n АЭ. Стратегией
активных элементов является выбор действий, стратегией центра –
выбор функции стимулирования, то есть зависимости вознаграж-
дения каждого АЭ от его действий и, быть может, действий других
АЭ.
Обозначим yi ? Ai - действие i-го АЭ, i ? I = {1, 2, …, n} –
n
? Ai -
множество АЭ, y = (y1, y2, ..., yn) ? A' = вектор действий
i =1
АЭ ; z = Q(y), где Q: A' > A0 - результат деятельности АЭ, входя-
1


щих в систему. Введем следующее обозначение: ( yi1 ; y ?i ) =
2


? Aj .
( y1 , y 2 , …, yi2?1 , yi1 , yi2+1 , …, y n ), yi1 ? Ai, y ?i ? A-i =
2 2
2 2

j ?i
Относительно допустимых множеств будем предполагать, что
выполнено следующее предположение:
А.1. ? i ? I Ai = [0; Ai+ ] ? ?1 , A0 = [0; A0 ] ? ?1 .
+
+ +
Интересы и предпочтения участников АС – центра и АЭ – вы-
ражены их целевыми функциями. Целевая функция центра ?(?)
представляет собой либо доход от деятельности АЭ (в этом случае
соответствующая задача управления (см. ниже и [44]) называется
задачей стимулирования первого рода), либо разность между дохо-
дом и суммарным вознаграждением, выплачиваемым АЭ (в этом
случае соответствующая задача управления (см. ниже и [44]) назы-
вается задачей стимулирования второго рода). Целевая функция
АЭ f(?) представляет собой разность между стимулированием,
получаемым от центра, и затратами.


1
Пока предполагается, что множества допустимых действий отдель-
ных АЭ независимы (так называемая гипотеза независимого поведения
(ГНП)), ниже в восьмом разделе будет рассмотрен случай зависимых
множеств допустимых действий АЭ.
13



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Примем следующий порядок функционирования АС. Центру и
АЭ на момент принятия решения о выбираемых стратегиях (соот-
ветственно - функциях стимулирования и действиях) известны
целевые функции и допустимые множества всех участников АС.
Центр, обладая правом первого хода, выбирает функции стимули-
рования и сообщает их АЭ, после чего АЭ при известных функциях
стимулирования выбирают действия, максимизирующие их целе-
вые функции (иерархическая игра типа Г2 [3, 15, 24]).
Индивидуальные затраты i-го АЭ по выбору действия yi в об-
щем случае зависят от действий всех АЭ, то есть ci = ci(y). Относи-
тельно функций затрат АЭ будем считать, что они удовлетворяют
следующим предположениям:
А.2. ? yi ? Ai затраты i-го АЭ не убывают по yi, i? I.
А.3. 1) ? y ? A’ ci(y) ? 0; 2) ? y-i ? A-i ci(0, y-i) = 0, где y-i = (y1, y2, ...,
yi-1, yi+1, ..., yn) – обстановка для i-го АЭ.
Стимулирование i-го АЭ ?i(?), назначаемое центром, в общем
случае может зависеть от действий всех АЭ и от результата дея-
тельности системы, то есть ?i: A'?A0 > ?1. Относительно функций
стимулирования введем следующее предположение:
А.4. Функции стимулирования кусочно-непрерывны и принимают
неотрицательные значения.
Таким образом, целевая функция i-го АЭ имеет вид "стимули-
рование минус затраты"1:
(1) fi(y, ?i) = ?i(y, z) - ci(y), i ? I.
В настоящей работе мы будем в основном рассматривать зада-
чи стимулирования второго рода (возможности переноса результа-
тов исследования задач второго рода на задачи первого рода и
наоборот подробно обсуждаются в [44]), поэтому целевая функция
центра, представляющая собой в задаче стимулирования второго
рода разность между доходом от действий АЭ и результатов дея-
тельности системы H(y, z) и суммарными затратами на стимулиро-
n
? ? i ( y ,Q( y )) , имеет вид:
вание ?(y) =
i =1


1
В настоящей работе принята независимая нумерация формул внутри
каждого подраздела.
14



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
n
? ? i ( y ,Q( y )) ,
(2) ?(y,?) = H(y, Q(y)) -
i =1
где ? = (?1, ?2, ..., ?n) ? M, M - множество допустимых систем
стимулирования.
Относительно множества допустимых функций стимулирова-
ния ограничимся пока следующим качественным замечанием
(конкретизация ограничений производится ниже при рассмотрении
конкретных моделей) - следует различать два типа ограничений. В
первом случае могут, дополнительно к А.4, быть наложены огра-
ничения на индивидуальное стимулирование: ?i ? Mi, i ? I, а об-
щие ограничения на стимулирование в активной системе отсутст-
n
? Mi .
вуют, то есть ? ? M = Во втором случае может
i =1
добавляться дополнительное общее (глобальное) ограничение Mгл
на систему индивидуальных стимулирований (совокупность функ-
n
? Mi
ций стимулирования): ? ? M = ? Mгл.
i =1
Обозначим Par(B, {fi}) – множество недоминируемых по Па-
рето элементов множества B ? A; E(?) – множество равновесных
стратегий АЭ.
В многоэлементной активной системе в качестве множества
решений игры (множества реализуемых действий) P(?) может
рассматриваться множество недоминируемых по Парето равнове-
сий в доминантных стратегиях Ed(?) (если оно существует), равно-
весий Нэша EN(?) или каких-либо других некооперативных1 (и
оговариваемых в каждом конкретном случае) теоретико-игровых

1
Данное предположение (о некооперативном характере взаимодействия
активных элементов) чрезвычайно важно для всего последующего изло-
жения. Допущение наличия коалиционных эффектов с одной стороны
привело бы к необходимости соответствующего определения решения
игры, а с другой стороны, несомненно, расширило бы как содержатель-
ные интерпретации, так и области возможных приложений рассматри-
ваемых формальных моделей. Тем не менее, в настоящей работе мы
ограничимся концепцией равновесия Нэша.
15



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
концепций равновесия; то есть P(?) = Par(E(?), {fi}). По умолча-
нию под равновесием (реализуемых векторов действий) ниже мы
будем подразумевать равновесие Нэша (то есть E(?) - множество
равновесных по Нэшу при заданной системе стимулирования
векторов стратегий АЭ). Другими словами, будем считать, во-
первых, что на момент принятия решений о выбираемых стратеги-
ях АЭ и центр имеют полную информацию [56, 66] о целевых
функциях и допустимых множествах (а также о глобальных огра-
ничениях) всех участников, и, во-вторых, что АЭ выбирают свои
стратегии одновременно и независимо друг от друга, не имея
возможности обмениваться дополнительной информацией.
Сделав маленькое отступление, напомним, что доминантной
стратегией i-го АЭ yid ? Ai называется такая его стратегия, которая
удовлетворяет: ? y-i ? A-i ? yi ? Ai fi(yid, y-i) ? fi(yi, y-i). Если для
всех АЭ существуют доминантные стратегии, то их вектор yd ? A'
называется равновесием в доминантных (РДС). Равновесием Нэша
называется такой вектор yN ? A' стратегий АЭ, который удовлетво-
ряет: ? i ? I ? yi ? Ai fi(yiN, y-iN) ? fi(yi, y-iN) [45, 46].
Итак, предположим, что при использовании центром системы
стимулирования ? ? M множество решений игры АЭ (то есть -
множество действий, реализуемых системой стимулирования ?)
есть P(?) ? A'.
Как и в одноэлементной активной системе, эффективностью
(гарантированной эффективностью) стимулирования является
максимальное (минимальное) значение целевой функции центра на
соответствующем множестве решений игры:
(3) K(?) = max ?(y,?),
y ?P( ? )
min ?(y,?).
(4) Kg(?) =
y ?P( ? )
Задача синтеза оптимальной функции стимулирования заклю-
чается в поиске допустимой системы стимулирования ?* ? M,
имеющей максимальную (максимальную гарантированную) эф-
фективность:
(5) ?* = arg max K(?),
? ?M


16



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
(6) ?g* = arg max Kg(?).
? ?M
Как отмечалось выше и в [44], задача синтеза оптимальной
системы стимулирования фактически сводится либо к анализу
множеств реализуемых действий, либо (и) к анализу минимальных
затрат на стимулирование. В одноэлементной активной системе
множеством решений игры (реализуемых действий) является
множество действий АЭ, доставляющих максимум его целевой
функции. В многоэлементной АС элементы вовлечены в игру -
выигрыш каждого АЭ в общем случае зависит как от его собствен-
ных действий, так и от действий других АЭ (напомним, что в
настоящей работе допускается лишь некооперативное взаимодей-
ствие участников системы). Поэтому основное качественное отли-
чие задач стимулирования в многоэлементных системах по сравне-
нию с одноэлементными (помимо увеличения числа участников
системы и соответствующего ему "линейному" по их числу росту
сложности задачи) заключается в том, что в многоэлементных
системах множество решений игры может иметь достаточно слож-
ную структуру. В том числе, например, одной системой стимули-
рования могут реализовываться несколько Парето эффективных (с
точки зрения АЭ) векторов действий и т.д.
Другими словами, отсутствие на сегодняшний день относи-
тельно полных (если принять за "идеал" совокупность результатов
исследования одноэлементных задач) аналитических методов
решения многоэлементных задач стимулирования, помимо высо-
кой их структурной и вычислительной сложности, отчасти объяс-
няется отсутствием единой концепции решения игры в теории игр
[22, 56, 66] - в зависимости от информированности игроков (участ-
ников АС), гипотез об их поведении и т.д. может изменяться теоре-
тическая оценка эффективности тех или иных управлений.
Еще раз подчеркнем, что при рассмотрении теоретико-
игровых моделей задач стимулирования в многоэлементных актив-
ных системах мы будем считать выполненными следующие два
общих предположения.
Первое предположение1 - гипотеза независимого поведения
(ГНП) АЭ, заключающаяся в том, что в АС отсутствуют глобаль-
1
В восьмом разделе настоящей работы рассматривается ряд моделей
17



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
ные ограничения на совместный выбор элементами своих страте-
гий (формально это предположение отражено в использованном
выше определении множества допустимых векторов стратегий АЭ:
n
? Ai ). Если ГНП не выполнена, то есть существуют глобаль-
A' =
i =1
n
? Ai ? Aгл,
ные ограничения Aгл на выбираемые АЭ действия: A' =
i =1
то возможны следующие подходы. Соответствующая игра может
рассматриваться как игра с запрещенными ситуациями (запрещен
выбор действий из множества A’\Aгл) [24]. Альтернативой в неко-
тором смысле является выбор центром таких управлений (в задаче
стимулирования – функций стимулирования), которые реализовы-
вали бы действия, удовлетворяющие глобальным ограничениям
(при этом центр «берет на себя» проблему удовлетворения этим
ограничениям). Например, если в задаче планирования [15] согла-
сованный план принадлежит A', то в рамках гипотезы благожела-
тельного поведения АЭ заведомо выберут допустимые действия.
Второе предположение - предположение о бескоалиционности
поведения АЭ, которое означает, что АЭ выбирают свои стратегии
одновременно и независимо, не имея возможности образовывать
коалиции.1 При рассмотрении базовых моделей стимулирования в
многоэлементных АС в четвертом разделе мы кратко обсудим
возможности учета кооперативных возможностей участников АС.
Для получения целостной картины имеющегося положения
дел и выделения перспективных направлений исследований приве-
дем классификацию задач стимулирования в многоэлементных
детерминированных активных системах и укажем основные рабо-

стимулирования с глобальными ограничениями на множества допусти-
мых действий активных элементов, то есть модели, в которых ГНП не
выполнена. Результаты же первых семи разделов существенно использу-
ют предположение о возможности независимого выбора состояний
элементами.
1
В целом, для теории активных систем и большинства других разделов
теории управления, изучающих задачи стимулирования, на сегодняшний
день характерно исследование именно некооперативных моделей взаимо-
действия участников АС (исключениями являются [7, 24, 32, 36]).
18



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
ты, содержащие результаты, полученные в соответствующих на-
правлениях отечественными и зарубежными авторами.


3. КЛАССИФИКАЦИЯ ЗАДАЧ СТИМУЛИРОВАНИЯ В
МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ

Целевая функция i-го АЭ, определяемая разностью стимули-
рования и затрат, имеет вид: fi(y,?i) = ?i(y, z) - ci(y). Следовательно,
классифицируя задачи стимулирования в многоэлементных АС,
необходимо учитывать возможные свойства и ограничения на
функции стимулирования и затрат. Для описания конкретной
теоретико-игровой модели стимулирования предлагается исполь-
зовать значения признаков классификации по основаниям1, приво-
димым в следующем порядке - первичное основание, вторичное и
т.д.:
1. Переменные, от которых зависят функции стимулирования
(индивидуальные вознаграждения АЭ). По данному основанию
возможны следующие значения признаков:
- индивидуальное вознаграждение конкретного АЭ явным об-
разом зависит только от его собственных действий - ?i(y,z) = ?i(yi),
yi ? Ai, i ? I. При этом возможны следующие варианты:
¦ отсутствуют общие ограничения на индивидуальные сти-
n
? Mi ;
мулирования АЭ - ? ? M =
i =1
¦ присутствуют общие ограничения Mгл на стимулирование:
n
? Mi ? Mгл.
M=
i =1
- индивидуальное вознаграждение конкретного АЭ явным об-
разом зависит от вектора действий всех АЭ: ?i(y,z)=?i(y), i?I, y?A'.



1
Основанием классификации оснований вводимой системы классифика-
ций служит набор параметров, который однозначно описывает боль-
шинство моделей многоэлементных АС.
19



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
- индивидуальное вознаграждение конкретного АЭ явным об-
разом зависит от результата деятельности АС в целом: ?i(y,z)=?i(z),
i ? I, z ? A0.
- смешанная зависимость, когда индивидуальное вознагражде-
ние конкретного АЭ явным образом зависит и от результата дея-
тельности АС, и от вектора действий всех АЭ (например, аддитив-
˜
но: ?i(y,z) = ?i(y) + ? i(z), i ? I, y ? A', z ? A0 и т.д.).
2. Свойства функций затрат АЭ. Ограничимся пока рассмотре-
нием двух случаев - сепарабельных и несепарабельных затрат.
Функции затрат из набора {ci(y)} называются сепарабельными,
если изменение индивидуальных затрат каждого АЭ, вызванное
любым изменением его собственного действия, при фиксирован-
ной обстановке игры (действиях остальных АЭ) не зависит от этой
обстановки. Например, пусть gi(y-i), i ? I – произвольные действи-
тельнозначные функции. Тогда, очевидно, множества равновесий
Нэша (а также РДС) в АС с целевыми функциями АЭ {fi(y)} и в АС
с целевыми функциями АЭ {fi(y)+ gi(y-i)}, y ? A’, y-i ? A-i, совпада-
ют. В частности сепарабельными являются такие функции индиви-
дуальных затрат АЭ, которые зависят только от собственных дей-
ствий соответствующего АЭ. В силу отмеченных выше свойств
равновесий, частным случаем сепарабельности является аддитив-
ная зависимость индивидуальных затрат i-го АЭ от его действия и
действий остальных АЭ: ? yi ? Ai ? y-i ? A-i ci(y) = ci1 (yi) + ci2 (y-i),
+ +
ci1 : Ai > ?1 , ci2 : A-i > ?1 , i ? I. Для функций затрат, у которых
все производные второго порядка существуют и непрерывны,
достаточным условием сепарабельности является: ? i ? I ? j ? i ?
? 2 ci ( y )
y ? A’ = 0.
?yi ?y j
3. Унифицированность системы стимулирования. Ограничим-
ся персонифицированными и унифицированными системами сти-
мулирования. В первом случае функции стимулирования АЭ раз-
личны (общий случай "обычных" систем стимулирования,
оперируя с которыми мы будем опускать прилагательное "персо-
нифицированная"). Во втором случае функция стимулирования
одинакова для всех АЭ, но может для тех или иных АЭ зависеть от
20



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
их индивидуальных действий и т.д. - см. ниже. Для обозначения
унифицированных систем стимулирования ниже используется
символ "U".
4. Тип системы стимулирования, используемой для каждого
конкретного АЭ. В [3, 12-14, 21, 36, 44] при рассмотрении задач
стимулирования одноэлементных АС были введены так называе-
мые базовые системы стимулирования - C, K, L, D и других типов.
Следовательно, каждый из этих типов и их комбинаций1 является
потенциальным претендентом на использование в качестве персо-
нифицированной системы стимулирования некоторого (в общем
случае - любого) АЭ или унифицированной системы стимулирова-
ния для всех АЭ.
Обозначим ? - множество всех базовых систем стимулирова-
ния в одноэлементных АС: ?C, ?K, ?L, ?D, ?LL, ?L+C ? ?, ? = (?1, ?2, ...
?n), где ?i ? ?, i ? I - вектор типов систем стимулирования, исполь-
зуемых в рассматриваемой АС. Используя нижний индекс ?, мы
будем конкретизировать ограничения на вид индивидуальных
функций стимулирования в данной АС.
Комбинируя четыре значения признаков по первому основа-
нию классификации и два по второму, получаем следующие во-
семь2 основных классов моделей стимулирования в многоэлемент-
ных АС.
1
В работе [21] системы стимулирования, в которых на различных
подмножествах множества допустимых действий АЭ используются
различные базовые системы стимулирования, было предложено назы-
вать составными и обозначать последовательной записью их компо-
нент. Соответственно, системы стимулирования, являющиеся алгебраи-
ческой суммой базовых, было предложено называть суммарными и
обозначать суммой их компонент.
Учитывая третье основание классификации, получим шестнадцать
2

классов (с учетом унификации) и т.д., то есть, дополняя систему клас-
сификаций новыми основаниями (и следя за выполнением требований
полноты и непротиворечивости), можно породить еще большее число
более узких классов моделей. Кроме того, следует отметить, что мы
считаем, что параметры системы стимулирования и всех АЭ характе-
ризуются одним и тем же значением признака классификации по тому
или иному основанию. Например, если затраты сепарабельны, то они
сепарабельны у всех АЭ. В общем случае (отказываясь от этого предпо-
21



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Модель S1.
Описание модели: индивидуальное вознаграждение каждого
АЭ явным образом зависит только от его собственных действий,
затраты сепарабельны. Возможны следующие варианты. Первый -
общие ограничения на индивидуальные стимулирования АЭ отсут-
ствуют (этот класс моделей обозначим S10) - получаем набор не-
связанных одноэлементных задач стимулирования [15, 44]. Второй
вариант - присутствуют общие ограничения на систему стимулиро-
вания в АС (этот класс моделей обозначим S1M) - получаем АС со
слабо связанными АЭ [15, 20, 42, 44].
Учет возможности использования центром унифицированных
систем стимулирования добавляет еще два класса моделей US10 и
US1M (напомним, что добавление символа "U" означает переход к
соответствующей унифицированной системе стимулирования).
Приведем пример использования введенной системы обозна-
чений (см. также систему обозначений, введенную в [44]). Пусть
имеется АС с тремя АЭ, имеющими сепарабельные затраты, и
центр использует индивидуальное стимулирование, зависящее
только от действия соответствующего АЭ, причем для первых двух
АЭ используются скачкообразные системы стимулирования, а для
третьего - пропорциональная система стимулирования. Тогда
модель стимулирования в данном классе АС описывается следую-
щим образом: US10?, где ? = (C, C, L), или сокращенно - US10(C,C,L).
Модель S21.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит только от его собственных дейст-
вий, затраты несепарабельны. Данный класс моделей практически
не исследован, некоторые результаты теоретико-игрового анализа
близких кооперативных моделей приведены в [32].

ложения) можно получить еще большее число комбинаций. Кроме того,
выделенные классы неравнозначны (например, модель S4 включает в себя
модель S1 как частный случай и т.д.). Оправданием может служить
обсуждаемая ниже для случая «смешанных» значений признаков воз-
можность комбинации результатов исследования их компонентов.
1
Очевидно, что модель S1 является частным случаем модели S2, модель
S3 – частным случаем модели S4 и т.д. Тем не менее, в методических
целях все модели рассматриваются одинаково подробно.
22



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Модель S3.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит только от вектора действий всех
АЭ, затраты сепарабельны. Подклассом S3 являются ранговые
системы стимулирования (которые мы обозначим S3R), при ис-
пользовании которых индивидуальное вознаграждение АЭ зависит
либо от принадлежности его действия заранее заданному элементу
разбиения множества допустимых действий - так называемые
нормативные ранговые системы стимулирования (которые мы
обозначим S3RN), либо от места, занятого конкретным АЭ в упо-
рядочении действий всех АЭ - так называемые соревновательные
ранговые системы стимулирования (которые мы обозначим S3RT
- от их англоязычного обозначения - rank-order tournament). В
теории контрактов исследовались методы решения (являющиеся
модификациями двух шагового метода [58]) дискретных много-
элементных вероятностных задач стимулирования [61, 63, 65],
соревновательные системы стимулирования изучались как в тео-
рии активных систем [42, 47, 55], так и в теории контрактов [57, 62,
64, 65] (см. также обзор [34]).
Модель S4.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит только от вектора действий всех
АЭ, затраты несепарабельны. Данный класс моделей практически
не исследован.
Модель S5.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит только от результата деятельности
АС, затраты сепарабельны. Данный класс моделей практически не
исследован, исключения – [1, 2, 18, 23].
Модель S6.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит только от результата деятельности
АС, затраты несепарабельны. Данный класс моделей практически
не исследован.
Модели S5 и S6 иногда называются моделями коллективного
стимулирования.


23



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Модель S71.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит и от вектора действий всех АЭ, и
от результата деятельности АС (смешанная зависимость), затраты
сепарабельны.
Модель S8.
Описание модели: индивидуальное вознаграждение конкрет-
ного АЭ явным образом зависит и от вектора действий всех АЭ, и
от результата деятельности АС (смешанная зависимость), затраты
несепарабельны.
Модели со смешанными зависимостями индивидуального
стимулирования от действий АЭ и результата деятельности АС в
литературе практически не исследовались.
Базовыми системами стимулирования в многоэлементных
активных системах назовем совокупность систем стимулирования
вида Sl?, где l ? {1, 2, ..., 8}, а ? - вектор базовых одноэлементных
систем стимулирования и их комбинаций, а также всех соответст-
вующих им унифицированных систем стимулирования.
Итак, при решении задач стимулирования в первую очередь
возникает необходимость ответа на следующие качественные
вопросы: от каких параметров должно зависеть стимулирование
того или иного АЭ - только лишь от его собственных действий или
же еще и от действий других элементов (или, например, от резуль-
тата деятельности всей АС), то есть должно ли стимулирование
быть индивидуальным или коллективным; следует ли использовать
для каждого АЭ свою собственную систему стимулирования,
учитывающую его специфику - потребности, возможности и т.д.,
или возможно ограничиться единой для всех АЭ2 (или определен-
ных их групп) системой стимулирования, то есть должно ли сти-

1
Для моделей S7 и S8 чрезвычайно важна информированность центра о
действиях АЭ и результатах деятельности АС. Так, если все действия
АЭ полностью наблюдаются центром, то информация о результате
деятельности АС избыточна (получаем модель S3 или S4) и т.д. (см.
подробное обсуждение в разделе 4.7).
2
Отметим, что при анализе эффективности персонифицированных и
унифицированных систем стимулирования мы не учитываем информаци-
онную нагрузку на управляющий орган, в отличие от, например, [36].
24



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
мулирование быть персонифицированным или унифицированным?
Естественно, ответы на эти и подобные им вопросы нельзя дать
исходя лишь из качественных соображений - необходимо исследо-
вать конкретные модели и количественно сравнивать эффективно-
сти тех или иных управлений. Поэтому перейдем к систематиче-
скому рассмотрению формальных моделей базовых систем
стимулирования в многоэлементных АС.


4. БАЗОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ В
МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ


4.1. МОДЕЛЬ S1: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ЕГО
ДЕЙСТВИЯ, ЗАТРАТЫ СЕПАРАБЕЛЬНЫ

Как отмечалось выше, модель S10 (в которой отсутствуют об-
щие ограничения на стимулирование) представляет набор несвя-
занных между собой одноэлементных моделей, причем (что явля-
ется важным для последующего изложения) каждое
индивидуально-рациональное действие каждого АЭ в АС S10 с
несвязанными АЭ является его доминантной стратегией.
В общем случае решение задачи синтеза оптимальной функ-
ции стимулирования состоит из двух этапов. Первый этап – этап
согласования стимулирования, заключается в поиске для каждого
допустимого действия АЭ системы стимулирования, реализующей
это действие (то есть побуждающей выбрать АЭ это действие как
доставляющее максимум его целевой функции) с минимальными
затратами центра на стимулирование (минимальной величиной
выплат АЭ за выбор этого действия). Второй этап – этап согласо-
ванного планирования, заключается в поиске оптимального с точки
зрения центра реализуемого действия, то есть действия, достав-
ляющего максимум целевой функции центра.




25



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
В [44] доказано, что в модели S1 в рамках гипотезы благоже-
лательности (ГБ)1 оптимальной является квазикомпенсаторная
система стимулирования
?c( y * ), y = y *
(1) ? K ( y , y ) = ?
*
,
y ? y*
?0,
где оптимальное реализуемое действие является решением сле-
дующей задачи оптимального согласованного планирования:
(2) y* = arg max {H(y) – c(y)}.
y?A
Содержательно центр компенсирует АЭ затраты при выборе
действия, совпадающего с действием y* и не вознаграждает АЭ при
выборе любых других действий. Использование системы стимули-
рования (1) обеспечивает реализуемость действия y* с минималь-
ными затратами центра на стимулирование.
Если ГБ не выполнена, то при определении эффективности
системы стимулирования центр вынужден использовать минимум
по множеству реализуемых действий АЭ. Для того чтобы побудить
АЭ гарантированно выбрать действие y*, центр должен использо-
вать систему стимулирования
?c( y * ) + ? , y = y *
(3) ? K ( y , y ) = ? , ? > 0,
*
y ? y*
? 0,
где оптимальное действие по-прежнему определяется выражением
(2).
Качественно при отказе от ГБ для гарантированной реализуе-
мости некоторого действия центр должен сделать это действие
единственной точкой максимума целевой функции АЭ. Для этого
(при определенных предположениях о функции затрат АЭ – см.
ниже) достаточно доплачивать за выбор этого действия, помимо
компенсации затрат, сколь угодно малую, но строго положитель-
ную величину (ср. (1) и (3)).

1
Напомним, что гипотеза благожелательности подразумевает, что из
множества решений игры (множества реализуемых действий, то есть
действий, доставляющих при заданной системе стимулирования макси-
мум целевой функции АЭ) АЭ выберет действие, наиболее благоприятное
для центра.
26



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Эффективность системы стимулирования (1) равна K1 = H(y*)
– c(y*), а гарантированная эффективность системы стимулирования
(3): K3 = H(y*) – c(y*) - ?. Разность эффективностей систем стиму-
лирования (1) и (3) равна ?, то есть непрерывна по аддитивному
параметру ?. Более того, в силу условия индивидуальной рацио-
нальности [44] ни одна другая система стимулирования не может
реализовать действие АЭ y* с затратами на стимулирование, строго
меньшими c(y*). Поэтому говорят, что системы стимулирования
типа (3) ?-оптимальны1 (то есть при устремлении ? к нулю эффек-
тивность системы стимулирования (3) может быть сделана сколь
угодно близкой к эффективности оптимальной системы стимули-
рования (1)).
Таким образом, в модели S10 оптимальны компенсаторные
системы стимулирования, причем использование идеи компенса-
ции затрат позволяет эффективно решать соответствующие задачи
стимулирования (задача (2) является стандартной задачей условной
оптимизации). Перейдем к рассмотрению задач стимулирования в
других АС из класса S1.
Частные модели унифицированных систем стимулирования
US10 рассматривались в [18, 36]; унифицированные скачкообраз-
ные UC и унифицированные пропорциональные UL системы сти-
мулирования подробно исследуются ниже в шестом разделе в
качестве важных с прикладной точки зрения частных случаев.
Рассмотрим модели с общими ограничениями на стимулиро-
вание элементов, то есть класс S1M механизмов стимулирования в
АС со слабо связанными АЭ.
При отсутствии глобальных ограничений вектор действий ак-
тивных элементов y* ? A’ реализуем с суммарными затратами на
n
стимулирование: ?(y ) = ? ci(yi*). Обозначим c(y) – вектор-
*

i =1
функцию затрат, ?(y) – вектор-функцию стимулирования.
Пусть имеются глобальные ограничения (выполняющиеся для
всех допустимых векторов действий АЭ): ? ? Mгл.

Напомним, что ?-оптимальной называется система стимулирования,
1

эффективность K(?) которой удовлетворяет: K(?) ? max K(?) - ?.
? ?M
27



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Воспользуемся результатами анализа задач стимулирования в
одноэлементных активных системах, в соответствии с которыми
оптимальной (в общем случае – одной из оптимальных) является
компенсаторная система стимулирования, при использовании
которой величина вознаграждения в точности равна затратам АЭ
по выбору соответствующего действия. Определим множество
действий, реализуемых при данных ограничениях: AM = {y ? A’ |
с(y) ? Mгл}. Далее, задача стимулирования сводится к следующей
стандартной задаче условной оптимизации: ?(y) > max . Задача
y?AM
первого рода при этом примет вид: H(y) > max , а задача второго
y?AM
рода: H(y) - ?(y) > max . Например, если имеется ограничение R
y?AM
на суммарные выплаты АЭ (то есть ограничен фонд заработной
n
? c i (y i ) ? R}.
платы (ФЗП)), то множество AM примет вид: {y?A’ |
i =1
При «предельном» переходе от АС со слабо связанными АЭ к
АС с независимыми АЭ описанный метод решения и результаты
его применения переходят соответственно в метод и результаты
решения набора одноэлементных задач стимулирования.
Пример 11. Пусть функция затрат i-го АЭ ci(yi) = yi2/2ri, i ? I, а
n
? yi .
функция дохода центра – H(y) = Тогда при ограниченном
i =1
ФЗП задача стимулирования первого рода примет вид:
?n
?? yi > max
?i =1 yi ?0
?n 2 . Применяя метод множителей Лагранжа, находим
yi
?? ?R
? i =1 2 ri
?




1
В настоящей работе принята сквозная нумерация примеров.
28



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
, i ? I, где
2R
оптимальный вектор реализуемых действий: yi* = ri
W
n
? ri . •1
W=
i =1
Взаимосвязь между индивидуальными вознаграждениями мо-
жет быть более сложной, что иллюстрируется приводимым ниже
примером.
Пример 2. Пусть в АС имеются два АЭ с функциями затрат
ci(yi) = yi2/2ri, i = 1, 2, а функция дохода центра равна сумме дейст-
вий АЭ: H(y) = y1 + y2. Предположим, что на индивидуальные
вознаграждения наложены независимые ограничения (содержа-
тельно, существует «вилка» заработной платы): d1 ? ?1 ? D1, d2 ? ?2
? D2, и, кроме этого, существует одно глобальное (общее ограни-
чение): ?2 ? ? ?1 (содержательно, например, второй АЭ имеет
более высокую квалификацию, чем первый – r2 ? r1, и поэтому за
одни и те же действия должен получать большее вознаграждение:
? ? 1). Приравнивая стимулирование затратам, получаем, что
множество реализуемых действий AM определяется следующей
системой неравенств (см. область, ограниченную на Рис. 2):
? ( r2 / r1 ) .
2 r1d1 ? y1 ? 2 r2 d 2 ? y2 ? 2 r2 D2 , y2 ?
2 r1 D1 ,
Оптимальным для центра в задаче стимулирования первого рода
является реализуемое действие y*, лежащее в верхней правой вер-
шине треугольника, заштрихованного на рисунке 2. •
Таким образом, основная идея решения задач стимулирования
в модели S1M (АС со слабо связанными АЭ) заключается в сле-
дующем: так как минимальное вознаграждение АЭ, реализующее
некоторое его действие, определяется его затратами по выбору
этого действия, то, приравнивая стимулирование затратам, мы
получаем возможность определить множество AM действий, реали-
зуемых при заданных ограничениях на стимулирование2. Перейдем

1
Символ «•» здесь и далее обозначает окончание примера, доказатель-
ства и т.д.
2
Если центр ограничен использованием определенных классов систем
стимулирования, то все приведенные рассуждения остаются в силе с
учетом того, что индивидуальные минимальные затраты на стимулиро-
29



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
к рассмотрению унифицированных систем стимулирования в АС
со слабо связанными АЭ.

y2 y2 = (? r2 / r1)1/2
*
y
2r2 D2
АM
H(y)




2r2 d 2
y1
0 2 r1 D1
2r1d 1

Рис. 2. Множество реализуемых действий в примере 2
Задачи синтеза унифицированных систем стимулирования в
АС со слабо связанными АЭ (US1M) решаются полностью анало-
гично тому, как это делается для персонифицированных систем
стимулирования. Предположим, что в многоэлементной АС с
ограниченным ФЗП существует упорядочение АЭ, такое, что
Ai = A, i ? I, и выполнено
? x ? A c1(x) ? c2(x) ? ... ? cn(x).
n
? c j(x)
Обозначим k(x,R) = min {i ? I | ? R}, тогда (n – k(x, R))
j =i
– число АЭ, которым выгодно выполнять допустимый с точки
зрения глобального ограничения R план x (см. также ниже и
[18, 36]). Элементам из множества Q(x,R) = {1, 2, ..., k(x,R)-1}
выполнение плана x невыгодно, и они выберут действия, миними-
зирующие затраты (в рамках А.3 такими действиями являются
действия, равные нулю). Следовательно, действия { yi* }, реализуе-


вание необходимо определять с учетом ограничений, наложенных на
механизм стимулирования.
30



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
мые унифицированной скачкообразной системой стимулирования с
точкой скачка x, определяются следующим образом:
? x , i ? k ( x, R )
y* (x,R) = ? .
0, i < k ( x, R )
i
?
Зная зависимость реализуемых действий от плана, центр дол-
жен решить задачу оптимального согласованного планирования –
найти план, максимизирующий целевую функцию центра:
x* = arg max ?( y1 (x,R), y2 (x,R), …, yn (x,R)).
*
* *
x ?0
При отказе от предположения об упорядоченности затрат АЭ
зависимость реализуемых действий от плана может иметь более
сложную структуру (см. [36]), однако идея решения полностью
сохраняется (с учетом увеличения числа рассматриваемых комби-
наций). Более подробно унифицированные системы стимулирова-
ния C-типа и L-типа рассматриваются в пятом и шестом разделах
настоящей работы.


4.2. МОДЕЛЬ S2: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ЕГО
ДЕЙСТВИЯ, ЗАТРАТЫ НЕ СЕПАРАБЕЛЬНЫ

Запишем определение равновесия Нэша для рассматриваемой
модели:
EN(?) = {yN?A | ? i?I ? yi?Ai ?i( yiN ) – ci( y N ) ? ?i(yi) – ci(yi, y ? i )}.
N

Фиксируем произвольный вектор действий АЭ y* ? A’ и рас-
смотрим следующую систему стимулирования:
?ci ( yi* , y ?i ) + ? i , yi = yi*
(1а) ?i(y , y) = ? , ?i ? 0, i ? I.
*

yi ? yi
*
? 0,
Коллективная1 система стимулирования (1а) реализует вектор
действий y* ? A’ как равновесие в доминантных стратегиях (РДС).


1
Система стимулирования (1а) является системой коллективного сти-
мулирования, так как размер вознаграждения каждого АЭ зависит как
от его собственных действий, так и от действий других АЭ.
31



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Теорема 4.2.1а. При использовании центром системы стиму-
лирования (1а) y* – РДС. Более того, если ?i > 0, i ? I, то y* – един-
ственное РДС.
Доказательство. Докажем сначала, что вектор y* ? A’ при
?i ? 0, i ? I, является равновесием Нэша. Пусть y* - не равновесие
Нэша. Тогда ? i ? I, ? ˜i ? Ai:
y
?i(y*, ˜i , y ?i ) – ci( ˜i , y ?i ) > ?i(y*, y*) – ci(y*).
* *
y y
Подставляя (1а), получаем, что ci( ˜i , y ?i ) < -?i – противоречие.
*
y
Докажем, что при ?i > 0, y* - единственное равновесие Нэша.
Пусть y’ ? A’ – равновесие Нэша, причем y’ ? y*. Тогда ? i ? I,
? yi ? Ai ?i(y*, yi’, y ? i ) – ci(yi’, y ? i ) ? ?i(y*, yi, y ? i ) – ci(yi, y ? i ).
' ' ' '


Подставляя yi = yi* , получаем: ci(yi’, y ? i ) ? -?i – противоречие.
'


Фиксируем произвольный номер i ? I и докажем, что yi* - до-
минантная стратегия i-го АЭ. Запишем определение доминантной
стратегии: ?i(y*, yi* , y-i) – ci( yi* , y-i) ? ?i(y*, yi, y-i) – ci(yi, y-i). Под-
ставляя (1а), получаем: ?i ? - ci(yi, y-i), что всегда имеет место в силу
предположения А.3.
Докажем, что y* - единственное РДС. Пусть существует РДС
y’ ? y*, тогда из определения доминантной стратегии следует, что
при использовании центром системы стимулирования (1а) выпол-
нено: ? i ? I: ci(y’) ? - ?i, что противоречит предположению А.3. •
Итак, система коллективного стимулирования (1а) реализует
заданный вектор действий АЭ как РДС (или при строго положи-
тельных константах ?i – как единственное РДС). Однако в модели
S2 стимулирование каждого АЭ зависит только от его собственно-
го действия. Поэтому, фиксировав для каждого АЭ обстановку
игры, перейдем от (1а) к следующей системе индивидуального
стимулирования. Фиксируем произвольный вектор действий АЭ
y* ? A’ и рассмотрим следующую систему стимулирования:
?ci ( yi* , y ?i ) + ? i , yi = yi*
*
(1б) ?i(y , yi) = ? , ?i ? 0, i ? I.
*

y i ? y*
? 0, i



32



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Отметим, что функция стимулирования (1б) зависит только от
действия i-го АЭ, а величина y* входит в нее как параметр. Кроме
того, при использовании центром системы стимулирования (1б), в
отличие от (1а), каждый из АЭ имеет косвенную информацию обо
всех компонентах того вектора действий, который хочет реализо-
вать центр. Для того, чтобы система стимулирования (1б) реализо-
вывала вектор y* как РДС необходимо введение дополнительных
(по сравнению со случаем использования (1а)) предположений
относительно функций затрат активных элементов.
Теорема 4.2.1б1. При использовании центром системы стиму-
лирования (1) y* ? EN(?). Более того:
а) если выполнено условие2:
(2) ? y1? y2 ? A’ ? i ? I: yi1 ? yi2 и ci(y1) + ci(y2) > ci( yi1 , y ?i ) - ?i,
2

то y* - единственное равновесие Нэша;
б) если выполнено условие:
(3) ? i? I, ? y1 ? y2 ? A’ ci(y1) + ci(y2) ? ci( yi1 , y ?i ) - ?i,
2

то вектор действий y* является равновесием в доминантных страте-
гиях;
в) если выполнено условие (3) и ?i > 0, i ? I, то вектор дейст-
вий y* является единственным равновесием в доминантных страте-
гиях.
Доказательство. То, что y* ? EN(?) при ?i ? 0, i ? I, следует из
приведенного выше определения равновесия Нэша для модели S2 и
выражения (1).
Докажем пункт а). Предположим, что выполнено (2) и сущест-
вует равновесие Нэша y’ ? y*. Тогда для любого АЭ i ? I (в том
числе и для такого, для которого выполнено yi' ? yi* ), выбор
стратегии yi' максимизирует его целевую функцию (в том числе и


1
Нумерация лемм, теорем и т.д. независимая внутри каждого раздела и
включает его номер.
2
В условии (2) можно использовать нестрогое неравенство, одновремен-
но требуя строгой положительности ?i. Точно так же в пункте в)
можно ослабить требование строгой положительности ?i, но рассмат-
ривать (3) как строгое неравенство.
33



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
по сравнению с выбором стратегии yi* ) при обстановке игры y ?i ,
'


значит выполнено: - ci(y’) ? ci(y*) + ?i – ci( yi* , y ?i ), что противоре-
'

чит (2).
Докажем пункт б). Запишем определение равновесия в доми-
нантных стратегиях (РДС) для рассматриваемой модели при ис-
пользовании центром системы стимулирования (1): y* - РДС тогда
и только тогда, когда
(4) ?i?I ?yi?Ai, yi? yi* y-i?A-i ci( yi* , y ?i ) - ci( yi* ,y-i) ? - ci(yi,y-i) - ?i.
*

Подставляя в (3) y1 = y*, y2 = y, получаем, что при ?i ? 0, i ? I,
выполнено (4).
Докажем пункт в). Предположим, что существует вектор дей-
ствий y’ ? A’, y’ ? y*, такой, что y’ ? Ed(?). Тогда система нера-
венств, аналогичная (4), имеет место и для y’. Подставляя в нее
y=y*, получим:
- ?i ? ci( yi' , y ?i ),
*

что при ?i >0 противоречит А.3. •
При ?i ? 0, i ? I, условие (3) выполнено, в частности, для лю-
бых сепарабельных затрат активных элементов; а условие (2) – для
сепарабельных строго монотонных функций затрат при ?i > 0, i ? I,
при этом стратегия (1) переходит в стратегию, оптимальную в
модели S1.
Отметим, что в модели S2 индивидуальное стимулирование
(1б) каждого АЭ зависит только от его собственных действий (ср. с
(1а) и моделью S4, в которой оптимальная функция стимулирова-
ния «похожа» на (1б), но зависит от действий всех АЭ, то есть
имеет вид (1а), что также позволяет центру реализовывать дейст-
вия в доминантных стратегиях).
Содержательно, при использовании системы стимулирования
(1б) центр говорит i-му активному элементу – выбирай действие
yi* , а я компенсирую тебе затраты, считая, что остальные АЭ
*
также выбрали соответствующие компоненты - y ?i , если же ты
выберешь любое другое действие, то вознаграждение будет равно
нулю. Используя такую стратегию, центр, фактически, декомпози-
рует игру элементов (см. модели S10 и S1M).
34



PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory
Идея декомпозиции игры активных элементов за счет исполь-
зования соответствующих компенсаторных функций стимулирова-
ния типа (1а) и (1б) оказывается ключевой для всего набора рас-
сматриваемых в настоящей работе моделей стимулирования в
многоэлементных активных системах.
Здесь же уместно качественно пояснить необходимость введе-
ния неотрицательных констант {?i} в выражении (1) (см. также
раздел 4.1). Если требуется реализовать некоторое действие как
одно из равновесий Нэша, то (как видно из формулировки и дока-
зательства теоремы) эти константы могут быть выбраны равными

стр. 1
(всего 6)

СОДЕРЖАНИЕ

>>