стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>

РОССИЙСКАЯ АКАДЕМИЯ НАУК
Институт проблем управления им. В.А. Трапезникова
Д.А. Новиков, А.В. Цветков
МЕХАНИЗМЫ СТИМУЛИРОВАНИЯ
В МНОГОЭЛЕМЕНТНЫХ ОРГАНИЗАЦИОННЫХ СИСТЕМАХ
Москва - 2000
УДК 007 ББК 32.81 Н 73
Н 73 Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: ООО "НИЦ ^<Апостроф", 2000. - 182 с.
ISBN 5-94155-005-7
Настоящая работа содержит результаты исследований задач стимулирования в двухуровневых организационных (активных) системах, включающих несколько управляемых субъектов (активных элементов): общую формулировку и классификацию задач стимулирования, решения задач синтеза оптимальных функций стимулирования в детерминированных системах и системах с неопределенностью, анализ сравнительной эффективности решений для различных моделей и зависимости свойств этих решений от параметров модели управляемой системы.
Значительное внимание уделяется изучению практически важных частных случаев: унифицированных, компенсаторных, линейных и других систем стимулирования, а также задачам управления организационными системами с технологически связанными элементами и задачам формирования состава системы.
Утверждено к печати Редакционным советом Института Рецензент: д.т.н., проф. В.Н. Бурков
УДК 007 ББК 32.81
Н 73
ISBN 5-94155-005-7
(c) Новиков Д.А., Цветков А.В., 2000
СОДЕРЖАНИЕ
1. Введение 5
2. Общая постановка задачи стимулирования
в многоэлементных активных системах 13
3. Классификация задач стимулирования
в многоэлементных активных системах 19
4. Базовые системы стимулирования
в многоэлементных активных системах 25
Модель S1: стимулирование АЭ зависит от его действия, затраты сепарабельны 25
Модель S2: стимулирование АЭ зависит от его действия, затраты не сепарабельны 31
Модель S3: стимулирование АЭ зависит от действий
всех АЭ, затраты сепарабельны 39
Модель S4: стимулирование АЭ зависит от действий
всех АЭ, затраты не сепарабельны 46
Модель S5: стимулирование АЭ зависит от результата деятельности АС, затраты сепарабельны 50
Модель S6: стимулирование АЭ зависит от результата деятельности АС, затраты не сепарабельны 56
Модели S7 и S8: стимулирование АЭ зависит от действий всех АЭ и результата деятельности АС,
затраты сепарабельны или не сепарабельны 59
5. Ранговые системы стимулирования 67
Нормативные ранговые системы стимулирования 67
Соревновательные ранговые системы стимулирования 78
6. Унифицированные пропорциональные
системы стимулирования 86
7. Стимулирование в многоэлементных АС
с неопределенностью 90
Внутренняя неопределенность 100
Интервальная неопределенность 101
Вероятностная неопределенность 104
Нечеткая неопределенность 106
Внешняя неопределенность 110
Интервальная неопределенность 117
Вероятностная неопределенность 120
Нечеткая неопределенность 122
8. Модели стимулирования с глобальными ограничениями
на множества допустимых действий АЭ 126
9. Производственные цепочки 138
10. Механизмы стимулирования
и задачи формирования состава активной системы 157
Заключение 176
Литература 178
1. ВВЕДЕНИЕ
Рассмотрим двухуровневую организационную (активную) систему веерного типа, состоящую из управляющего органа - центра - на верхнем уровне иерархии и управляемых субъектов - активных элементов на нижнем уровне. В работах [21, 42, 44] были предложены следующие основания системы классификаций моделей активных систем (см. рисунок 1): число активных элементов (одноэлементные и многоэлементные системы), число периодов функционирования (статические и динамические системы), тип и вид неопределенности (отсутствие неопределенности - детерминированные системы; в зависимости от информации о неопределенных параметрах - интервальные, вероятностные и нечеткие системы) и др.
Исторически исследования задач стимулирования и в теории активных систем (АС), и в других разделах теории управления социально-экономическими системами (теория иерархических игр [24, 25, 30], теория контрактов [57-60] и др.) начинались с изучения так называемых базовых - детерминированных, одноэлементных статических моделей (сектор I на рисунке 1), в которых помимо управляющего органа - центра, присутствовал единственный управляемый субъект - активный элемент (АЭ) [3, 4, 15].
Простейшим обобщением базовой одноэлементной модели является многоэлементная АС с независимыми (невзаимодействующими) АЭ. В этом случае задача стимулирования распадается на ряд одноэлементных задач [12-16]. Если ввести общие для всех или ряда АЭ ограничения на механизм стимулирования, то получается задача стимулирования в АС со слабо связанными элементами, в которой решается набор параметрических одноэлементных задач стимулирования, а проблема поиска оптимальных значений параметров решается стандартными методами условной оптимизации [20, 44].
Если активные элементы взаимосвязаны, то есть существуют общие ограничения на множества допустимых состояний, планов, действий, если результат деятельности одного АЭ зависит, помимо его собственных действий, от действий других элементов, или если стимулирование каждого АЭ зависит также и от результатов всех остальных АЭ, то получается "полноценная" многоэлементная задача стимулирования (сектор VII на Рис. 1), исследуемая в настоящей работе.

Рис. 1 Классификация задач стимулирования в АС

Общих подходов к аналитическому решению этого класса задач на сегодняшний день, к сожалению, не существует и исследован он гораздо менее детально и систематически, чем базовая модель (достаточно полный обзор современного состояния исследований задач стимулирования в многоэлементных и динамических социально-экономических системах приведен в [34]). В большинстве случаев частные модели многоэлементных АС
6
основываются либо на непосредственном обобщении результатов анализа базовой модели (в этом случае вычислительная сложность катастрофически растет с увеличением числа АЭ), либо на рассмотрении параметрически заданных классов, поиск оптимального решения в которых использует стандартную оптимизационную технику [15, 16, 29, 31, 44].
Также расширениями базовой модели являются одноэлементные статические системы с неопределенностью (сектора II - IV на Рис. 1) и детерминированные одноэлементные или многоэлементные динамические системы (сектор V на Рис. 1). В таблице 1 приведены ссылки на работы, содержащие результаты исследований соответствующих классов моделей I - VII. Отметим, что многоэлементные или динамические системы с неопределенностью (им соответствуют "пустые" сектора на Рис. 1) на сегодняшний день практически не исследованы.
Таблица 1. Основные работы по моделям механизмов стимулирования в
активных системах
Модель (см. рис.1.)
Основные работы
I
4, 12, 15, 19, 24, 30, 36, 37, 44
II
10, 13-15, 30, 33, 38, 39, 46, 50-54, 67
III
8, 9, 40, 43, 44, 58-65
IV
35, 41, 42, 44
V
4, 15, 30, 34, 55
VI
15, 34, 55
VII
4, 15, 18, 26-29, 31, 34, 36, 54, 61, 63, 65,

Охарактеризуем кратко основные подходы, используемые при решении одноэлементных задач (более подробное обсуждение, снабженное детальными ссылками на соответствующую литературу, приводится ниже при классификации и исследовании многоэлементных АС).
В одноэлементной активной системе стратегией центра, делающего первый ход, является выбор системы стимулирования, то есть зависимости вознаграждения (или штрафов) АЭ за результаты его деятельности. Стратегией активного элемента является выбор
7
(при известной функции стимулирования) действия, определяющего (в детерминированных АС - однозначно, в АС с неопределенностью - влияющего совместно с неопределенными факторами - состоянием природы) результат деятельности.
В теории активных систем обычно предполагается, что интересы участников выражены их целевыми функциями (целевая функция центра - разность между доходом от деятельности АЭ и стимулированием последнего, целевая функция АЭ - разность между стимулированием за выбор тех или иных действий и затратами по выбору этих действий), поэтому в рамках теоретико- игровых моделей рациональным считается поведение игроков, заключающееся в максимизации целевых функции с учетом всей имеющейся на момент принятия решений информации. Задача стимулирования заключается в поиске таких систем стимулирования, которые максимизировали бы целевую функцию центра при условии, что выбираемое активным элементом действие максимизирует целевую функцию элемента при этой системе стимулирования.
Ключевыми понятиями в базовых (детерминированных, одноэлементных, статических) задачах стимулирования являются понятия множества реализуемых действий и минимальных затрат на стимулирование. При заданной системе стимулирования множеством реализуемых действий является множество действий АЭ, выбор которых максимизирует значение его целевой функции. Если выполнена гипотеза благожелательности (ГБ - при прочих равных АЭ выбирает наиболее благоприятное для центра действие), то, очевидно, максимальную эффективность будут иметь классы систем стимулирования, для которых объединение множеств реализуемых действий максимально [15, 42].
Альтернативным подходом является использование минимальных затрат центра на стимулирование по реализации заданного действия, которые равны значению функции стимулирования на этом действии при условии, что данная система стимулирования реализует это действие. Понятно, что системы стимулирования, реализующие действия с меньшими затратами на стимулирование, имеют более высокую эффективность [42, 44].
8
Таким образом, решение задачи синтеза оптимальной функции стимулирования в одноэлементной АС может быть сведено к анализу соответствующих множеств реализуемых действий и/или минимальных затрат на стимулирование [44]. При этом оказывается, что максимальную эффективность имеют так называемые компенсаторные иди квазикомпенсаторные1 системы стимулирования (К-типа), которые компенсируют в определенном диапазоне (определяемым ограничениями на размер вознаграждения АЭ) активному элементу изменения затрат (или дохода), делая его целевую функцию постоянной в этом диапазоне [15, 44]. Как будет видно из дальнейшего изложения, идея компенсации затрат оказывается чрезвычайно плодотворной при решении задач стимулирования и в многоэлементных АС2.
Таким образом, основной вывод из результатов исследования задач стимулирования в одноэлементных АС, который будет обобщен в настоящей работе на случай многоэлементных АС, заключается в том, что минимальные затраты центра на стимулирование по реализации некоторого действия АЭ достигаются при использовании компенсаторной или квазикомпенсаторной системы стимулирования. При этом затраты центра на стимулирование в точности равны затратам АЭ по выбору этого действия, поэтому при решении задач планирования, определения минимальных ограничений на систему стимулирования и т.д., достаточно целевую функцию центра рассматривать как разность его функции дохода и функции затрат АЭ [44].
Последовательность решения и одноэлементных, и многоэлементных задач имеет много общего. Сначала необходимо построить компенсаторную систему стимулирования, реализующую некоторое (произвольное, или допустимое при заданных ограничениях) действие - первый этап - этап анализа согласованности стимулирования. В одноэлементных АС в рамках гипотезы благожелательности для этого достаточно проверить, что при этом максимум целевой функции АЭ будет достигаться, в том числе и на реализуемом действии. В многоэлементных АС достаточно показать, что выбор соответствующего действия является равновесной стратегией в игре активных элементов при заданной системе стимулирования. Если равновесий несколько, необходимо ввести и проверить выполнение для рассматриваемого действия дополнительной гипотезы о рациональном выборе элементов. В большинстве случаев достаточным оказывается введение аксиомы единогласия (АЭ не будут выбирать равновесия, доминируемые по Парето другими равновесиями), иногда центру приходится вычислять гарантированный результат по множеству равновесных стратегий элементов и т.д. (см. ниже более подробно).
Далее следует приравнять стимулирование затратам3 и решить стандартную оптимизационную задачу - какое из реализуемых действий следует реализовывать центру - второй этап - этап согласованного планирования [6-9, 15, 16, 51-54, 58].
Помимо компенсаторных систем стимулирования, как на практике, так и в теоретико-игровых моделях широко распространены другие системы стимулирования, также называемые базовыми системами стимулирования. Среди них: скачкообразная система стимулирования (С-типа), при использовании которой АЭ в зависимости от величины своих действий либо поощряется на фиксированную величину, либо не поощряется вообще; пропорциональная система стимулирования (линейная - L-типа), в которой величина вознаграждения прямо пропорциональна действию АЭ; системы стимулирования D-типа (основанные на участии АЭ в доходе или прибыли от деятельности АС в целом) и др. [21, 36, 42, 44].
Перечисленные системы стимулирования являются базовыми для одноэлементных АС, составляя основу "конструктора", позволяющего моделировать практически любую из используемых на практике систем индивидуального стимулирования. Некоторые из них не являются оптимальными (в смысле максимального значения целевой функции центра, которое достигается в частности при использовании компенсаторных систем стимулирования), поэтому при изучении как одноэлементных, так и многоэлементных моделей приходится исследовать их сравнительную эффективность.
Изложение материала настоящей работы имеет следующую структуру. Во втором разделе приводится общая постановка задачи стимулирования в многоэлементной АС, в третьем разделе вводится система классификаций задач такого рода и выделяются "базовые" для многоэлементных АС модели: S1 - S8. Четвертый раздел полностью посвящен исследованию этих восьми моделей и, в частности - изучению сравнительной эффективности базовых систем стимулирования, набор которых подробно описан в [21, 44]. В пятом и шестом разделах рассматриваются практически важные частные случаи механизмов стимулирования: ранговые системы стимулирования, унифицированные системы стимулирования и др. Седьмой раздел посвящен систематическому исследованию задач
используемая в настоящей работе трактовка индивидуальной рациональности представляется вполне обоснованной.
11
стимулирования с многоэлементных АС, функционирующих в условиях неопределенности (внешней и внутренней, интервальной, вероятностной и нечеткой). В восьмом разделе рассматриваются модели стимулирования с глобальными ограничениями на множества допустимых действий АЭ. Полученные при этом исследовании теоретические результаты применяются в девятом разделе при описании практически важного частного случая взаимозависимости АЭ - производственных цепочек. И, наконец, в десятом разделе результаты решения задач стимулирования используются для решения задач формирования состава многоэлементных АС. Заключение содержит качественное обсуждение основных результатов и перспективных направлений дальнейших исследований.
12
2. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ СТИМУЛИРОВАНИЯ В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ
Рассмотрим многоэлементную детерминированную двухуровневую активную систему, состоящую из центра и n АЭ. Стратегией активных элементов является выбор действий, стратегией центра - выбор функции стимулирования, то есть зависимости вознаграждения каждого АЭ от его действий и, быть может, действий других АЭ.
Обозначим у, е Л, - действие z-го АЭ, i е I = {1, 2, n} -
n
множество АЭ, у = (у/, у2, ..., yn) е Л' = ПЛ, - вектор действий
i=1
АЭ4; Z = Q(y), где Q: Л' (r) Ло - результат деятельности АЭ, входя-
1 2
щих в систему. Введем следующее обозначение: (у^; ) =
(у2,у2, .. Уi^_l, У1, Уi^+l, .. y2), у! еy5i еЛ-, = ПЛJ.
J*i
Относительно допустимых множеств будем предполагать, что выполнено следующее предположение:
А.1. ^i е I Л, = [0; Л+ ] с , Л0 = [0; Л0+ ] с
Интересы и предпочтения участников АС - центра и АЭ - выражены их целевыми функциями. Целевая функция центра Ф( ) представляет собой либо доход от деятельности АЭ (в этом случае соответствующая задача управления (см. ниже и [44]) называется задачей стимулирования первого рода), либо разность между доходом и суммарным вознаграждением, выплачиваемым АЭ (в этом случае соответствующая задача управления (см. ниже и [44]) называется задачей стимулирования второго рода). Целевая функция АЭ J(-) представляет собой разность между стимулированием, получаемым от центра, и затратами.
Примем следующий порядок функционирования АС. Центру и АЭ на момент принятия решения о выбираемых стратегиях (соответственно - функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников АС. Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их АЭ, после чего АЭ при известных функциях стимулирования выбирают действия, максимизирующие их целевые функции (иерархическая игра типа Г2 [3, 15, 24]).
Индивидуальные затраты i-го АЭ по выбору действия у, в общем случае зависят от действий всех АЭ, то есть С, = С,(У). Относительно функций затрат АЭ будем считать, что они удовлетворяют следующим предположениям: А.2. V У, е Л, затраты i-го АЭ не убывают по У,, ie I. А.3. 1) V у е Л' С,(у) > 0; 2) V у-, е Л-, c,(0, у.,) = 0, где у-, = (y/, у2, ..., Уi-/, yi+/, ..., УП) - обстановка для i-го АЭ.
Стимулирование i-го АЭ о,( ), назначаемое центром, в общем случае может зависеть от действий всех АЭ и от результата деятельности системы, то есть о,: Л'хЛ0 (r) ^ . Относительно функций стимулирования введем следующее предположение: А.4. Функции стимулирования кусочно-непрерывны и принимают неотрицательные значения.
Таким образом, целевая функция i-го АЭ имеет вид "стимулирование минус затраты"6: (1) у;(у, о,) = о,(у, z) - С,(у), i е I.
В настоящей работе мы будем в основном рассматривать задачи стимулирования второго рода (возможности переноса результатов исследования задач второго рода на задачи первого рода и наоборот подробно обсуждаются в [44]), поэтому целевая функция центра, представляющая собой в задаче стимулирования второго рода разность между доходом от действий АЭ и результатов деятельности системы Н(у, z) и суммарными затратами на стимулиро- n
вание ^(у) = XОi(y,Q(у)) , имеет вид: i=1
(2) Ф(у, о) = Н(у, Q(y)) - XОi(У,Q(у)) ,
i=1
где о = (о/, о2, ..., Оп) е M, M - множество допустимых систем стимулирования.
Относительно множества допустимых функций стимулирования ограничимся пока следующим качественным замечанием (конкретизация ограничений производится ниже при рассмотрении конкретных моделей) - следует различать два типа ограничений. В первом случае могут, дополнительно к А.4, быть наложены ограничения на индивидуальное стимулирование: о, е M, i е I, а общие ограничения на стимулирование в активной системе отсутст-
n
вуют, то есть о е M = П M,. Во втором случае может
i=1
добавляться дополнительное общее (глобальное) ограничение M;^ на систему индивидуальных стимулирований (совокупность функ-
n
ций стимулирования): о е M = П M, пM^^.
i=1
Обозначим Par(B, {fi}) - множество недоминируемых по Па- рето элементов множества B с Л; Е(о) - множество равновесных стратегий АЭ.
В многоэлементной активной системе в качестве множества решений игры (множества реализуемых действий) Р(о) может рассматриваться множество недоминируемых по Парето равновесий в доминантных стратегиях Ей(о) (если оно существует), равновесий Нэша Елг(о) или каких-либо других некооперативных7 (и оговариваемых в каждом конкретном случае) теоретико-игровых концепций равновесия; то есть Р(о) = Раг(Е(о), {fi}). По умолчанию под равновесием (реализуемых векторов действий) ниже мы будем подразумевать равновесие Нэша (то есть Е(о) - множество равновесных по Нэшу при заданной системе стимулирования векторов стратегий АЭ). Другими словами, будем считать, во- первых, что на момент принятия решений о выбираемых стратегиях АЭ и центр имеют полную информацию [56, 66] о целевых функциях и допустимых множествах (а также о глобальных ограничениях) всех участников, и, во-вторых, что АЭ выбирают свои стратегии одновременно и независимо друг от друга, не имея возможности обмениваться дополнительной информацией.
Сделав маленькое отступление, напомним, что доминантной стратегией i-го АЭ у,^ е Л, называется такая его стратегия, которая удовлетворяет: V у-, е Л-, V у, е Л, у-,) >Л(у,, у-,). Если для
всех АЭ существуют доминантные стратегии, то их вектор у^ е Л' называется равновесием в доминантных (РДС). Равновесием Нэша называется такой вектор У е Л' стратегий АЭ, который удовлетворяет: V i е I Vу, е Л, /(ул, уЛ > ^(у,, уЛ [45, 46].
Итак, предположим, что при использовании центром системы стимулирования о е M множество решений игры АЭ (то есть - множество действий, реализуемых системой стимулирования о) есть Р(о) с Л'.
Как и в одноэлементной активной системе, эффективностью (гарантированной эффективностью) стимулирования является максимальное (минимальное) значение целевой функции центра на соответствующем множестве решений игры:
(3) К(о) = max Ф(у, о),
у^Р(о)
(4) К^(о) = min Ф(у,о).
уеР(о)
Задача синтеза оптимальной функции стимулирования заключается в поиске допустимой системы стимулирования о е M, имеющей максимальную (максимальную гарантированную) эффективность:
(5) о* = arg max К(о),
о eM
16 (6) Оg = arg max Kg(о).
о eM
Как отмечалось выше и в [44], задача синтеза оптимальной системы стимулирования фактически сводится либо к анализу множеств реализуемых действий, либо (и) к анализу минимальных затрат на стимулирование. В одноэлементной активной системе множеством решений игры (реализуемых действий) является множество действий АЭ, доставляющих максимум его целевой функции. В многоэлементной АС элементы вовлечены в игру - выигрыш каждого АЭ в общем случае зависит как от его собственных действий, так и от действий других АЭ (напомним, что в настоящей работе допускается лишь некооперативное взаимодействие участников системы). Поэтому основное качественное отличие задач стимулирования в многоэлементных системах по сравнению с одноэлементными (помимо увеличения числа участников системы и соответствующего ему "линейному" по их числу росту сложности задачи) заключается в том, что в многоэлементных системах множество решений игры может иметь достаточно сложную структуру. В том числе, например, одной системой стимулирования могут реализовываться несколько Парето эффективных (с точки зрения АЭ) векторов действий и т.д.
Другими словами, отсутствие на сегодняшний день относительно полных (если принять за "идеал" совокупность результатов исследования одноэлементных задач) аналитических методов решения многоэлементных задач стимулирования, помимо высокой их структурной и вычислительной сложности, отчасти объясняется отсутствием единой концепции решения игры в теории игр [22, 56, 66] - в зависимости от информированности игроков (участников АС), гипотез об их поведении и т.д. может изменяться теоретическая оценка эффективности тех или иных управлений.
Еще раз подчеркнем, что при рассмотрении теоретико- игровых моделей задач стимулирования в многоэлементных активных системах мы будем считать выполненными следующие два общих предположения.
Первое предположение8 - гипотеза независимого поведения (ГНП) АЭ, заключающаяся в том, что в АС отсутствуют глобаль- ные ограничения на совместный выбор элементами своих стратегий (формально это предположение отражено в использованном выше определении множества допустимых векторов стратегий АЭ:
n
Л' = П Ai). Если ГНП не выполнена, то есть существуют глобаль-
i=1
n
ные ограничения Л.^ на выбираемые АЭ действия: Л' = ПЛ, пЛ^^,
i=1
то возможны следующие подходы. Соответствующая игра может рассматриваться как игра с запрещенными ситуациями (запрещен выбор действий из множества A'^IA.^) [24]. Альтернативой в некотором смысле является выбор центром таких управлений (в задаче стимулирования - функций стимулирования), которые реализовы- вали бы действия, удовлетворяющие глобальным ограничениям (при этом центр "берет на себя" проблему удовлетворения этим ограничениям). Например, если в задаче планирования [15] согласованный план принадлежит Л', то в рамках гипотезы благожелательного поведения АЭ заведомо выберут допустимые действия.
Второе предположение - предположение о бескоалиционности поведения АЭ, которое означает, что АЭ выбирают свои стратегии одновременно и независимо, не имея возможности образовывать коалиции.9 При рассмотрении базовых моделей стимулирования в многоэлементных АС в четвертом разделе мы кратко обсудим возможности учета кооперативных возможностей участников АС.
Для получения целостной картины имеющегося положения дел и выделения перспективных направлений исследований приведем классификацию задач стимулирования в многоэлементных детерминированных активных системах и укажем основные рабо- ты, содержащие результаты, полученные в соответствующих направлениях отечественными и зарубежными авторами.
3. КЛАССИФИКАЦИЯ ЗАДАЧ СТИМУЛИРОВАНИЯ В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ
Целевая функция i-го АЭ, определяемая разностью стимулирования и затрат, имеет вид: Л(у,о,) = о,^, z) - с,(у). Следовательно, классифицируя задачи стимулирования в многоэлементных АС, необходимо учитывать возможные свойства и ограничения на функции стимулирования и затрат. Для описания конкретной теоретико-игровой модели стимулирования предлагается использовать значения признаков классификации по основаниям10, приводимым в следующем порядке - первичное основание, вторичное и т.д.:
1. Переменные, от которых зависят функции стимулирования (индивидуальные вознаграждения АЭ). По данному основанию возможны следующие значения признаков:
- индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий - Оi(y,z) = о,(у,), у, е Л,, i е I. При этом возможны следующие варианты:
¦ отсутствуют общие ограничения на индивидуальные сти-
n
мулирования АЭ - о е M = П Mi ;
i=1
¦ присутствуют общие ограничения M.^ на стимулирование:
M = П M^ П M;^.. i =1
- индивидуальное вознаграждение конкретного АЭ явным образом зависит от вектора действий всех АЭ: оi(y,z)=оi(y), ieI, уеЛ'.
- индивидуальное вознаграждение конкретного АЭ явным образом зависит от результата деятельности АС в целом: оi(y,z)=оi(z), i е I, z е Л0.
- смешанная зависимость, когда индивидуальное вознаграждение конкретного АЭ явным образом зависит и от результата деятельности АС, и от вектора действий всех АЭ (например, аддитивно: оi(y,z) = ог(у) + <7i(z), i е I, у е Л', z е Л0 и т.д.).
2. Свойства функций затрат АЭ. Ограничимся пока рассмотрением двух случаев - сепарабельных и несепарабельных затрат.
Функции затрат из набора {с,(у)} называются сепарабельными, если изменение индивидуальных затрат каждого АЭ, вызванное любым изменением его собственного действия, при фиксированной обстановке игры (действиях остальных АЭ) не зависит от этой обстановки. Например, пусть gi(y-,), i е I - произвольные действительнозначные функции. Тогда, очевидно, множества равновесий Нэша (а также РДС) в АС с целевыми функциями АЭ {fi(y)} и в АС с целевыми функциями АЭ {fi(y)+ gi(y-i)}, у е Л', y-i е A-i, совпадают. В частности сепарабельными являются такие функции индивидуальных затрат АЭ, которые зависят только от собственных действий соответствующего АЭ. В силу отмеченных выше свойств равновесий, частным случаем сепарабельности является аддитивная зависимость индивидуальных затрат i-го АЭ от его действия и
1 2
действий остальных АЭ: Vу, е Л, Vе A-i с,(у) = С, (у,) + С, (y-i),
С1 : Л, (r) , С2 : A-i (r) , i е I. Для функций затрат, у которых все производные второго порядка существуют и непрерывны, достаточным условием сепарабельности является: V i е I V j ^ i V
у е Л' ^:ci(y) = 0.
3. Унифицированность системы стимулирования. Ограничимся персонифицированными и унифицированными системами стимулирования. В первом случае функции стимулирования АЭ различны (общий случай "обычных" систем стимулирования, оперируя с которыми мы будем опускать прилагательное "персонифицированная"). Во втором случае функция стимулирования одинакова для всех АЭ, но может для тех или иных АЭ зависеть от
20
их индивидуальных действий и т.д. - см. ниже. Для обозначения унифицированных систем стимулирования ниже используется символ "U".
4. Тип системы стимулирования, используемой для каждого конкретного АЭ. В [3, 12-14, 21, 36, 44] при рассмотрении задач стимулирования одноэлементных АС были введены так называемые базовые системы стимулирования - C, K, L, D и других типов. Следовательно, каждый из этих типов и их комбинаций11 является потенциальным претендентом на использование в качестве персонифицированной системы стимулирования некоторого (в общем случае - любого) АЭ или унифицированной системы стимулирования для всех АЭ.
Обозначим T - множество всех базовых систем стимулирования в одноэлементных АС: ос, ок, оь, ов, оц, оь+с е T, t = (^1, X2, ... tn), где t, е T, i е I - вектор типов систем стимулирования, используемых в рассматриваемой АС. Используя нижний индекс t, мы будем конкретизировать ограничения на вид индивидуальных функций стимулирования в данной АС.
Комбинируя четыре значения признаков по первому основанию классификации и два по второму, получаем следующие во- семь12 основных классов моделей стимулирования в многоэлементных АС.
Модель S1.
Описание модели: индивидуальное вознаграждение каждого АЭ явным образом зависит только от его собственных действий, затраты сепарабельны. Возможны следующие варианты. Первый - общие ограничения на индивидуальные стимулирования АЭ отсутствуют (этот класс моделей обозначим S1o) - получаем набор несвязанных одноэлементных задач стимулирования [15, 44]. Второй вариант - присутствуют общие ограничения на систему стимулирования в АС (этот класс моделей обозначим S1M) - получаем АС со слабо связанными АЭ [15, 20, 42, 44].
Учет возможности использования центром унифицированных систем стимулирования добавляет еще два класса моделей US10 и US1M (напомним, что добавление символа "U" означает переход к соответствующей унифицированной системе стимулирования).
Приведем пример использования введенной системы обозначений (см. также систему обозначений, введенную в [44]). Пусть имеется АС с тремя АЭ, имеющими сепарабельные затраты, и центр использует индивидуальное стимулирование, зависящее только от действия соответствующего АЭ, причем для первых двух АЭ используются скачкообразные системы стимулирования, а для третьего - пропорциональная система стимулирования. Тогда модель стимулирования в данном классе АС описывается следующим образом: US10T, где t = (С, С, L), или сокращенно - US10(C,C,b).
Модель S2
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит только от его собственных действий, затраты несепарабельны. Данный класс моделей практически не исследован, некоторые результаты теоретико-игрового анализа близких кооперативных моделей приведены в [32].
Модель S3.
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты сепарабельны. Подклассом S3 являются ранговые системы стимулирования (которые мы обозначим S3R), при использовании которых индивидуальное вознаграждение АЭ зависит либо от принадлежности его действия заранее заданному элементу разбиения множества допустимых действий - так называемые нормативные ранговые системы стимулирования (которые мы обозначим S3RN), либо от места, занятого конкретным АЭ в упорядочении действий всех АЭ - так называемые соревновательные ранговые системы стимулирования (которые мы обозначим S3RT - от их англоязычного обозначения - rank-order tournament). В теории контрактов исследовались методы решения (являющиеся модификациями двух шагового метода [58]) дискретных многоэлементных вероятностных задач стимулирования [61, 63, 65], соревновательные системы стимулирования изучались как в теории активных систем [42, 47, 55], так и в теории контрактов [57, 62, 64, 65] (см. также обзор [34]).
Модель S4.
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит только от вектора действий всех АЭ, затраты несепарабельны. Данный класс моделей практически не исследован.
Модель S5.
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС, затраты сепарабельны. Данный класс моделей практически не исследован, исключения - [1, 2, 18, 23].
Модель S6.
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит только от результата деятельности АС, затраты несепарабельны. Данный класс моделей практически не исследован.
Модели S5 и S6 иногда называются моделями коллективного стимулирования.
23
Модель S7
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит и от вектора действий всех АЭ, и от результата деятельности АС (смешанная зависимость), затраты сепарабельны.
Модель S8.
Описание модели: индивидуальное вознаграждение конкретного АЭ явным образом зависит и от вектора действий всех АЭ, и от результата деятельности АС (смешанная зависимость), затраты несепарабельны.
Модели со смешанными зависимостями индивидуального стимулирования от действий АЭ и результата деятельности АС в литературе практически не исследовались.
Базовыми системами стимулирования в многоэлементных активных системах назовем совокупность систем стимулирования вида Slt, где l е {1, 2, ..., 8}, а t - вектор базовых одноэлементных систем стимулирования и их комбинаций, а также всех соответствующих им унифицированных систем стимулирования.
Итак, при решении задач стимулирования в первую очередь возникает необходимость ответа на следующие качественные вопросы: от каких параметров должно зависеть стимулирование того или иного АЭ - только лишь от его собственных действий или же еще и от действий других элементов (или, например, от результата деятельности всей АС), то есть должно ли стимулирование быть индивидуальным или коллективным; следует ли использовать для каждого АЭ свою собственную систему стимулирования, учитывающую его специфику - потребности, возможности и т.д., или возможно ограничиться единой для всех АЭ13 (или определенных их групп) системой стимулирования, то есть должно ли сти- мулирование быть персонифицированным или унифицированным? Естественно, ответы на эти и подобные им вопросы нельзя дать исходя лишь из качественных соображений - необходимо исследовать конкретные модели и количественно сравнивать эффективности тех или иных управлений. Поэтому перейдем к систематическому рассмотрению формальных моделей базовых систем стимулирования в многоэлементных АС.
4. БАЗОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ
4.1. МОДЕЛЬ S1: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ЕГО ДЕЙСТВИЯ, ЗАТРАТЫ СЕПАРАБЕЛЬНЫ
Как отмечалось выше, модель S10 (в которой отсутствуют общие ограничения на стимулирование) представляет набор несвязанных между собой одноэлементных моделей, причем (что является важным для последующего изложения) каждое индивидуально-рациональное действие каждого АЭ в АС S10 с несвязанными АЭ является его доминантной стратегией.
В общем случае решение задачи синтеза оптимальной функции стимулирования состоит из двух этапов. Первый этап - этап согласования стимулирования, заключается в поиске для каждого допустимого действия АЭ системы стимулирования, реализующей это действие (то есть побуждающей выбрать АЭ это действие как доставляющее максимум его целевой функции) с минимальными затратами центра на стимулирование (минимальной величиной выплат АЭ за выбор этого действия). Второй этап - этап согласованного планирования, заключается в поиске оптимального с точки зрения центра реализуемого действия, то есть действия, доставляющего максимум целевой функции центра.
25

В [44] доказано, что в модели S1 в рамках гипотезы благожелательности (ГБ)14 оптимальной является квазикомпенсаторная система стимулирования
с * *
(1) ок (у , у) =
С(у ), у = у
,0, у ^ у"
где оптимальное реализуемое действие является решением следующей задачи оптимального согласованного планирования:
(2) у* = arg max {Я(у) - c(y)}.
уеЛ
Содержательно центр компенсирует АЭ затраты при выборе действия, совпадающего с действием у и не вознаграждает АЭ при выборе любых других действий. Использование системы стимулирования (1) обеспечивает реализуемость действия у с минимальными затратами центра на стимулирование.
Если ГБ не выполнена, то при определении эффективности системы стимулирования центр вынужден использовать минимум по множеству реализуемых действий АЭ. Для того чтобы побудить АЭ гарантированно выбрать действие у , центр должен использовать систему стимулирования
(3) о к (у^, у) = |0( у + ', ^ = ^ > 0,
I0, у ^ у
где оптимальное действие по-прежнему определяется выражением (2).
Качественно при отказе от ГБ для гарантированной реализуемости некоторого действия центр должен сделать это действие единственной точкой максимума целевой функции АЭ. Для этого (при определенных предположениях о функции затрат АЭ - см. ниже) достаточно доплачивать за выбор этого действия, помимо компенсации затрат, сколь угодно малую, но строго положительную величину (ср. (1) и (3)).

Эффективность системы стимулирования (1) равна K/ = H(y*) - c(y*'), а гарантированная эффективность системы стимулирования (3): К3 = H(y*) - c(y*) - 5. Разность эффективностей систем стимулирования (1) и (3) равна 5, то есть непрерывна по аддитивному параметру 5. Более того, в силу условия индивидуальной рациональности [44] ни одна другая система стимулирования не может реализовать действие АЭ у с затратами на стимулирование, строго меньшими c(y ). Поэтому говорят, что системы стимулирования типа (3) е-оптимальны15 (то есть при устремлении 5 к нулю эффективность системы стимулирования (3) может быть сделана сколь угодно близкой к эффективности оптимальной системы стимулирования (1)).
Таким образом, в модели S10 оптимальны компенсаторные системы стимулирования, причем использование идеи компенсации затрат позволяет эффективно решать соответствующие задачи стимулирования (задача (2) является стандартной задачей условной оптимизации). Перейдем к рассмотрению задач стимулирования в других АС из класса S1.
Частные модели унифицированных систем стимулирования US10 рассматривались в [18, 36]; унифицированные скачкообразные UC и унифицированные пропорциональные UL системы стимулирования подробно исследуются ниже в шестом разделе в качестве важных с прикладной точки зрения частных случаев.
Рассмотрим модели с общими ограничениями на стимулирование элементов, то есть класс S1M механизмов стимулирования в АС со слабо связанными АЭ.
При отсутствии глобальных ограничений вектор действий ак-
* А >
тивных элементов у е Л реализуем с суммарными затратами на
* n *
стимулирование: J(y) = ^ ci(yi'). Обозначим c(y) - вектор-
,=1
функцию затрат, о(у) - вектор-функцию стимулирования.
Пусть имеются глобальные ограничения (выполняющиеся для всех допустимых векторов действий АЭ): о е M...
Воспользуемся результатами анализа задач стимулирования в одноэлементных активных системах, в соответствии с которыми оптимальной (в общем случае - одной из оптимальных) является компенсаторная система стимулирования, при использовании которой величина вознаграждения в точности равна затратам АЭ по выбору соответствующего действия. Определим множество действий, реализуемых при данных ограничениях: Лм = {у е Л' | с(у) е Мгл}. Далее, задача стимулирования сводится к следующей
стандартной задаче условной оптимизации: Ф(у) (r) max . Задача
уеЛм
первого рода при этом примет вид: H(y) (r) max , а задача второго
уеЛм
рода: H(y) - J(y) (r) max . Например, если имеется ограничение R
уеЛм
на суммарные выплаты АЭ (то есть ограничен фонд заработной
n
платы (ФЗП)), то множество ЛМ примет вид: {уеЛ' | ^ С, (у,) ? R}.
i=1
При "предельном" переходе от АС со слабо связанными АЭ к АС с независимыми АЭ описанный метод решения и результаты его применения переходят соответственно в метод и результаты решения набора одноэлементных задач стимулирования.
Пример 116. Пусть функция затрат i-го АЭ с,(у,) = уг17/2г,, i е I, а
n
функция дохода центра - H(y) = ^ у, . Тогда при ограниченном
i=1
ФЗП задача стимулирования первого рода примет вид:
n
у, (r) m;lax
i=1n 2 i . Применяя метод множителей Лагранжа, находим
? R
i=1 2 ri
оптимальный вектор реализуемых действий: у,* = r, , i е I, где
W= ^tr. . •18
i=1
Взаимосвязь между индивидуальными вознаграждениями может быть более сложной, что иллюстрируется приводимым ниже примером.
Пример 2. Пусть в АС имеются два АЭ с функциями затрат с,(у,) = У19/2Г,, i = 1, 2, а функция дохода центра равна сумме действий АЭ: H(y) = y/ + У2. Предположим, что на индивидуальные вознаграждения наложены независимые ограничения (содержательно, существует "вилка" заработной платы): d/ ? о/ ? D/, d2 ? о2 ? D2, и, кроме этого, существует одно глобальное (общее ограничение): о2 > b о/ (содержательно, например, второй АЭ имеет более высокую квалификацию, чем первый - Г2 ? r/, и поэтому за одни и те же действия должен получать большее вознаграждение: b > 1). Приравнивая стимулирование затратам, получаем, что множество реализуемых действий ЛМ определяется следующей системой неравенств (см. область, ограниченную на Рис. 2):
yj2r1d1 ?y/ ? ^2r1D1, д/2Г2d2 ?у2 ? V^r^D^, У2 > .
Оптимальным для центра в задаче стимулирования первого рода
*
является реализуемое действие у , лежащее в верхней правой вершине треугольника, заштрихованного на рисунке 2. •
Таким образом, основная идея решения задач стимулирования в модели S1M (АС со слабо связанными АЭ) заключается в следующем: так как минимальное вознаграждение АЭ, реализующее некоторое его действие, определяется его затратами по выбору этого действия, то, приравнивая стимулирование затратам, мы получаем возможность определить множество ЛМ действий, реализуемых при заданных ограничениях на стимулирование2. Перейдем к рассмотрению унифицированных систем стимулирования в АС со слабо связанными АЭ.

л/2ГА
Рис. 2. Множество реализуемых действий в примере 2
0
V2r1d1

Задачи синтеза унифицированных систем стимулирования в АС со слабо связанными АЭ (US1M) решаются полностью аналогично тому, как это делается для персонифицированных систем стимулирования. Предположим, что в многоэлементной АС с ограниченным ФЗП существует упорядочение АЭ, такое, что Л, = Л, i е I, и выполнено
V X е Л c/(x) > c2(x) >... > cn(x).
n
Обозначим k(x,R) = min {i е I | t Cj(x) ? R}, тогда (n - k(x, R))
J=i
- число АЭ, которым выгодно выполнять допустимый с точки зрения глобального ограничения R план x (см. также ниже и [18, 36]). Элементам из множества Q(x,R) = {1, 2, ..., k(x,R)-1} выполнение плана x невыгодно, и они выберут действия, минимизирующие затраты (в рамках А.3 такими действиями являются
действия, равные нулю). Следовательно, действия { у* }, реализуе-
мые унифицированной скачкообразной системой стимулирования с точкой скачка x, определяются следующим образом:
у, (x,R) =
'x, i > k(x, R)
0, i < k(x, R).
Зная зависимость реализуемых действий от плана, центр должен решить задачу оптимального согласованного планирования - найти план, максимизирующий целевую функцию центра:
x* = arg max Ф( y*(x,R), y**(x,R), y;*(x,R)).
x>0
При отказе от предположения об упорядоченности затрат АЭ зависимость реализуемых действий от плана может иметь более сложную структуру (см. [36]), однако идея решения полностью сохраняется (с учетом увеличения числа рассматриваемых комбинаций). Более подробно унифицированные системы стимулирования C-типа и L-типа рассматриваются в пятом и шестом разделах настоящей работы.
4.2. МОДЕЛЬ S2: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ЕГО ДЕЙСТВИЯ, ЗАТРАТЫ НЕ СЕПАРАБЕЛЬНЫ
Запишем определение равновесия Нэша для рассматриваемой модели:
Е^(о) = {/еЛ I V ieI VуеЛ, о( у,') - c( yN) > о,(у) - С,(у, у-!,)}.
Фиксируем произвольный вектор действий АЭ у е Л' и рассмотрим следующую систему стимулирования:
(1а) о,(у: у) = |С' (У**,У-') + 5 i, У' = У*, 5, > 0, i е I.
[ 0, у, ^ у,
Коллективная20 система стимулирования (1а) реализует вектор действий у е Л' как равновесие в доминантных стратегиях (РДС).

Теорема 4.2.1а. При использовании центром системы стимулирования (1а) у - РДС. Более того, если S, > 0, i е I, то у - единственное РДС.
Доказательство. Докажем сначала, что вектор у е Л' при
51 > 0, i е I, является равновесием Нэша. Пусть у* - не равновесие Нэша. Тогда $ i е I, $ ^у, е Л,:
ог(у*, , у^, ) - С,( у , у-, ) > о,(у*, у*) - С,(у*).
Подставляя (1а), получаем, что с,(уу,, у_,-) < -5, - противоречие.
Докажем, что при 5i > 0, у* - единственное равновесие Нэша. Пусть у' е Л' - равновесие Нэша, причем у' ^ у*. Тогда V i е I,
V у, е Л, о,(у", у,', у-,) - С,(у,', у-,) > о,(у", у,, у -,) - с,(у,, у -,).
* ' О
Подставляя у, = у, , получаем: у) < -5, - противоречие.
*
Фиксируем произвольный номер i е I и докажем, что у^ - доминантная стратегия i-го АЭ. Запишем определение доминантной
**
стратегии: о,(у , у^ , у-,) - с,( у^ , у-,) > о,(у , у,, у-,) - с,(у,, у-,). Подставляя (1а), получаем: ^ > - с,(у,, y-i), что всегда имеет место в силу предположения А.3.
Докажем, что у - единственное РДС. Пусть существует РДС
*
у ^у , тогда из определения доминантной стратегии следует, что при использовании центром системы стимулирования (1а) выполнено: $ i е I: с,(у') ? - 5,, что противоречит предположению А.3. •
Итак, система коллективного стимулирования (1а) реализует заданный вектор действий АЭ как РДС (или при строго положительных константах 5, - как единственное РДС). Однако в модели
52 стимулирование каждого АЭ зависит только от его собственного действия. Поэтому, фиксировав для каждого АЭ обстановку игры, перейдем от (1а) к следующей системе индивидуального
стимулирования. Фиксируем произвольный вектор действий АЭ
*
у е Ли рассмотрим следующую систему стимулирования:
* * *
(/б) о( * ) С'(У"У-,) + 5', у, = у, 5 > 0 ¦ е л
(1б) о,(у , у,) = ^ * , 5, > 0, 1 е I.
0, у, ^ у,
32
Отметим, что функция стимулирования (1б) зависит только от действия i-го АЭ, а величина у входит в нее как параметр. Кроме того, при использовании центром системы стимулирования (1б), в отличие от (1 а), каждый из АЭ имеет косвенную информацию обо всех компонентах того вектора действий, который хочет реализовать центр. Для того, чтобы система стимулирования (1б) реализо- вывала вектор у как РДС необходимо введение дополнительных (по сравнению со случаем использования (1а)) предположений относительно функций затрат активных элементов.
Теорема 4.2.1б21. При использовании центром системы стимулирования (1) у е Е'(о). Более того:
а) если выполнено условие22:
(2) V у1^у2 е Л' $i е I: у1 ^ у,2 и Cl(y/) + Ci(y2) > Ci(у1, у2,) - 5,
то у* - единственное равновесие Нэша;
б) если выполнено условие:
(3) V ie I, V у1 ^ у2 е Л' Ciiy1) + Ci(y2) > Ci( у1, у2,) - 5i,
*
то вектор действий у является равновесием в доминантных стратегиях;
в) если выполнено условие (3) и 5i > 0, i е I, то вектор дейст-
*
вий у является единственным равновесием в доминантных стратегиях.
Доказательство. То, что у е Е^Со) при 5, > 0, i е I, следует из приведенного выше определения равновесия Нэша для модели S2 и выражения (1).
Докажем пункт а). Предположим, что выполнено (2) и существует равновесие Нэша у Ф у . Тогда для любого АЭ i е I (в том числе и для такого, для которого выполнено y^ Ф у* ), выбор
стратегии у^ максимизирует его целевую функцию (в том числе и
по сравнению с выбором стратегии у* ) при обстановке игры у^^,
^ с * '
значит выполнено: - ci(y') > ci(y ) + ^ - ci( у, , y-i), что противоречит (2).
Докажем пункт б). Запишем определение равновесия в доминантных стратегиях (РДС) для рассматриваемой модели при использовании центром системы стимулирования (1): у - РДС тогда и только тогда, когда
(4) VieI VyleЛl, У.Фу* y-leЛ-l Ci( у*, у*,) - Ci( у* ,y-i) > - Ci(yi,y-i) - 5,.
Подставляя в (3) у1 = у*, у2 = у, получаем, что при 5, > 0, i е I, выполнено (4).
Докажем пункт в). Предположим, что существует вектор действий у' е Л', у' Ф у*, такой, что у' е Ed(о). Тогда система неравенств, аналогичная (4), имеет место и для у'. Подставляя в нее
*
у=у , получим:
- ^i > С1( У* ,У *-1 ), что при S* >0 противоречит А.3. •
При S* > 0, i е I, условие (3) выполнено, в частности, для любых сепарабельных затрат активных элементов; а условие (2) - для сепарабельных строго монотонных функций затрат при 5i > 0, i е I, при этом стратегия (1) переходит в стратегию, оптимальную в модели S1.
Отметим, что в модели S2 индивидуальное стимулирование (1б) каждого АЭ зависит только от его собственных действий (ср. с (1а) и моделью S4, в которой оптимальная функция стимулирования "похожа" на (1б), но зависит от действий всех АЭ, то есть имеет вид (1а), что также позволяет центру реализовывать действия в доминантных стратегиях).
Содержательно, при использовании системы стимулирования (1б) центр говорит i-му активному элементу - выбирай действие
у*, а я компенсирую тебе затраты, считая, что остальные АЭ
также выбрали соответствующие компоненты - у^,, если же ты
выберешь любое другое действие, то вознаграждение будет равно нулю. Используя такую стратегию, центр, фактически, декомпозирует игру элементов (см. модели S10 и S1M). 34
Идея декомпозиции игры активных элементов за счет использования соответствующих компенсаторных функций стимулирования типа (1а) и (1б) оказывается ключевой для всего набора рассматриваемых в настоящей работе моделей стимулирования в многоэлементных активных системах.
Здесь же уместно качественно пояснить необходимость введения неотрицательных констант {S*} в выражении (1) (см. также раздел 4.1). Если требуется реализовать некоторое действие как одно из равновесий Нэша, то (как видно из формулировки и доказательства теоремы) эти константы могут быть выбраны равными нулю (см. также системы стимулирования (1) и (3) в разделе 4.1). Если же мы хотим, чтобы равновесие было единственным (в частности, чтобы АЭ не выбирали нулевые действия), то элементам следует доплатить сколь угодно малую, но строго положительную величину за выбор именно того действия, которое предлагается центром. Более того, величины {5*} в выражении (1) (и других подобных конструкциях, встречающихся ниже при исследовании модели S4 и др.) играют важную роль и с точки зрения устойчивости компенсаторной системы стимулирования (1) по параметрам модели. Например, если функция затрат i-го АЭ известна с точностью до Л* ? 5* / 2, то система стимулирования (1) все равно реализует действие у (см. доказательства и подробное обсуждение в [37]).
Пример 3. Рассмотрим АС, состоящую из двух АЭ с функция-
(у, + у-, )2
ми затрат ci(y) = -^ ^-, i = 1, 2. Легко проверить, что данные
2rr
функции затрат удовлетворяют условиям (2) и (3).
Единственность равновесия Нэша можно доказать непосредственно следующим образом. Пусть центр использует систему стимулирования (1) и имеются два различных равновесия Нэша: у и у. Записывая определения равновесий Нэша, получаем, что должна иметь место следующая система неравенств:
35
(У1)23 + (у*)2 ? 2у* У2(1 - -
У1 У2 * ' ?
(У1)2 + (у*)2 ? 2У1 y^d--)
у1 у2
которая несовместна, то есть, если выполнено первое неравенство, то не выполнено второе, и наоборот. •
Вектор оптимальных реализуемых действий АЭ у*, фигурирующий в качестве параметра в выражении (1), определяется в результате решения следующей задачи оптимального согласован-
ного планирования: у = arg max {H(t) - c(t)}, а гарантированная
tsA
эффективность системы стимулирования (1) равна следующей
* n *
величине: K/ = H(y*) - t (с* (У ) + 5*) .
i=1
Теорема 4.2.2. Класс (с параметром у ) систем стимулирования
n
(1) является S-оптимальным в модели S2, где S = 15* .
i=1
Доказательство. Теоремы 4.2.1а и 4.2.1б утверждают, что при использовании систем стимулирования (1а) и (1б), соответственно, действие у является равновесием (Нэша или РДС). При S* = 0, i е I, эта система стимулирования характеризуется минимально возможными затратами на стимулирование , следовательно, по теореме о том, что оптимальным является класс систем стимулирования, реализующих действия с минимальными затратами на стимулирование [42, 44], класс систем стимулирования (1) имеет максимальную эффективность в задачах стимулирования как первого, так и второго рода.
При использовании системы стимулирования (1) затраты цен*
тра на стимулирование по реализации действия у равны следую- щей величине: 1 (с* (у*) + 5^) .
i=1
Предположим, что существует другая система стимулирования, которая реализует то же действие у*, но с меньшими затратами на стимулирование. Из условия индивидуальной рациональности АЭ следует, что затраты на стимулирование по реализации вектора
n *
действий у не могут быть меньше, чем 1 с* (у ). Так как функция
i=1
стимулирования входит в целевую функцию центра аддитивно, то потери эффективности при использовании центром системы сти-
n
мулирования (1) не превышают S = 15* . •
i=1
Отметим, что при доказательстве теоремы 4.2.2 не использовалась сепарабельность затрат АЭ, то есть результат этой теоремы справедлив, не только для модели S2, но и для ряда других моделей АС с несепарабельными затратами (см. ниже).
Так как теорема 4.2.2 гласит, что оптимален класс систем стимулирования (1), то есть оптимальная функция стимулирования
принадлежит этому классу, а сам класс задан параметрически (с
*
параметром - у ), то остается найти оптимальное значение параметра. Другими словами, необходимо определить какое действие следует центру реализовывать системой стимулирования (1).
Если на систему стимулирования, используемую центром, не наложено никаких ограничений, то решение задачи стимулирования второго рода заключается в вычислении на основании (1)
n
минимальных затрат на стимулирование: J(y ) = 1 ci(y ) и поис-
i=1
ке вектора действий x е Л', максимизирующего целевую функцию центра: x* = arg max [H(y) - J(y)].
ysA
Если на функции стимулирования наложено следующее ограничение о e M, то на первом шаге решения задачи стимулирования необходимо найти множество действий АЭ, реализуемых системами стимулирования вида (1), при заданных ограничениях. Делается это следующим образом: ищется множество действий АЭ Лм,
37
затраты от выбора которых после подстановки в (1) не нарушают ограничений на стимулирование: Лм = {у еЛ' | V ieI О1(У , у*) е М*, у е Р(о)}. Второй шаг решения задачи остается без изменений (необходимо только учесть, что максимизация ведется по множеству Лм):
x*м = arg max [H(y) - J(y)].
У^Лм
Рассмотрим пример, иллюстрирующий использование предложенного подхода.
Пример 4. Рассмотрим задачу стимулирования первого рода в
(у, + a у_-)2
АС с двумя АЭ, имеющими функции затрат: ci(y) = - * '
2r
i=1, 2, где a - некоторый параметр. Пусть функция дохода центра H(y) = y/ + у2, а фонд заработной платы ограничен величиной R (глобальное ограничение). Если центр использует систему стимулирования (1), то задача стимулирования первого рода сводится к поиску оптимальных реализуемых действий:
H (у) (r) max
(5)
у>0
[С1(у) + С2(у) ? R
Предполагая существование внутреннего решения и применяя метод множителей Лагранжа, получаем, что решение задачи (5) имеет вид:
* 2R a r2 - r1 * 2R a r1 - r2
(6) у* = J^ , у* = J^ ^"Г •
yrj + Г2 a - 1 yrL + Г2 a2 - 1
Отметим, что при a=0 выражение (6) переходит в оптимальное решение, полученное в примере 1 для модели S1M. •
В заключение настоящего подраздела отметим, что чрезвычайно интересным и перспективным направлением будущих исследований представляется изучение модели S2 в предположении возможности образования коалиций активными элементами. Допущение кооперативного поведения, несомненно, породит новые свойства модели (и, естественно, новые трудности ее анализа), однако, как отмечалось выше, их рассмотрение выходит за рамки настоящей работы.
38

4.3. МОДЕЛЬ S3: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ДЕЙСТВИЙ ВСЕХ АЭ, ЗАТРАТЫ СЕПАРАБЕЛЬНЫ
Предположим, что индивидуальные затраты i-го АЭ зависят только от его собственных действий: с* = ci(yi) (случай сепарабель- ных затрат). Тогда при заданной системе коллективного (то есть - зависящего от действий всех АЭ) стимулирования о = {О1(У)} множество решений игры Р(о) АЭ является множеством EN{о) равновесий Нэша, определяемым следующим образом:
(1) Ем(о) = {у* е Л' I V ieI, VуеЛ, О1(У*) - Ci(yi*) > О1(У.;, у,,) - с^}.
Суммарные затраты центра на стимулирование равны:
(2) ^(у,о) = 1 о i (у).
i=1
Обозначим id"an(y), у е Л' - значение целевой функции в следующей задаче:
J(у,о) (r) min
(3) \ о еМ .
[ у еEN(О)
Если для некоторого у' е Л' решения задачи (3) не существует, то положим Jmin(y') = +?. Содержательно, Jmin(y) - минимальные затраты на стимулирование по реализации действия у е Л'. Вычислив минимальные затраты на стимулирование, можно определить действие, реализация которого наиболее выгодна для центра, то есть максимальная эффективность коллективного стимулирования в данной модели в рамках гипотезы благожелательности равна:
(4) K = max {H(y) - Jmin(y)}.
уеЛ
Решение задачи (2)-(4) чрезвычайно трудоемко с вычислительной точки зрения, и даже для простых примеров редко удается получить ее аналитическое решение. Поэтому рассмотрим возможности "упрощения" этого класса задач стимулирования, то есть сведения их к более простым с точки зрения, как процесса решения, так и исследования зависимости оптимального решения от параметров модели, задачам.
Перейдем к рассмотрению индивидуального стимулирования. Обозначим <7 (у) = ((71 (y/), <72 (у2), ..., (Уп (yn)) - систему индивиду-
39
ального стимулирования. При использовании индивидуального
n
стимулирования множество решений игры есть Р( о )= ^ Р ((7*),
i=1
где
(5) Pi( ^i) = Arg max {a^ (yi) - CiCy,)}.
y* eAi
Суммарные затраты на индивидуальное стимулирование равны:
(6) J (= 17, (y,).
i =1
Обозначим Jmin (y), у e Л' - значение целевой функции в следующей задаче:
(7)
J(ст, у) (r) min
сгеМ .
у е Pia)
Если для некоторого у' е Л' решения задачи (7) не существует, то положим Jmin(y') = +?. Максимальная эффективность индивидуального стимулирования в модели S3 в рамках гипотезы благожелательности равна:
(5) = maxx {H(y) - J^miniy)}.
уеЛ
Следующая теорема дает ответ на вопрос о сравнительной эффективности использования индивидуального и коллективного стимулирования в рассматриваемой модели.
Теорема 4.3.1. В модели S3 для любой системы коллективного стимулирования найдется система индивидуального стимулирования не меньшей эффективности.
Доказательство теоремы. Так как множество всех допустимых систем коллективного стимулирования включает в себя множество всех допустимых систем индивидуального стимулирования (последние могут рассматриваться как частный случай, так как имеет место U Р(^) с U En (О) ), то, очевидно, что K > K . Поэтому
отеМ о еМ
докажем, что K = K, то есть, что не может иметь места K > K .
Выражения (4) и (8) отличаются лишь минимальными затра-
40

тами на стимулирование. Обозначим у* = arg max {H(y) - Jmin(y)}24,
уе Л'
о (у) - оптимальную систему коллективного стимулирования (для которой выполнено у е Ем(о*) и для которой величина J(о, у*) минимальна). Фиксируем произвольный номер i е I. Из у* е Ем(о*) следует, что
(9) V у, е Л, Оl(y') - Ci( у*) > о^ , у) - Ciiy,).
7*
Выберем индивидуальную систему стимулирования о * (у*)
следующим образом (частный случай у*-трансформации игры элементов в терминологии [22]):
(10) V i е I djiyi) = о;( y-i, у,).
* 7*
Так как о е М, то о е М. Подставляя (10) в (9), получим,
что
(11) V i е I Vу, е Л, ^i*(у*) - Ci(у*) > ^i*(у*) - cfy,),
*
то есть у е Р(о ), причем из (2), (6) и (10) следует, что выполнено: J(y*, о*) = J (у*, д ), то есть по теореме 2.2, приведенной в
7*
работе [42], система стимулирования о обладает эффективностью, не меньшей, чем исходная система стимулирования. •
Таким образом, теорема 4.3.1 утверждает, что в случае сепара- бельных затрат для любой системы коллективного стимулирования можно построить систему индивидуального стимулирования, которая будет обладать той же эффективностью. Переход от одной системы стимулирования к другой осуществляется достаточно просто - индивидуальное вознаграждение каждого АЭ в случае индивидуального стимулирования равно его же индивидуальному вознаграждению в случае коллективного стимулирования при условии, что все остальные элементы выбирают равновесные по Нэшу действия.
Итак, в соответствии с теоремой 4.3.1 для любой системы коллективного стимулирования (в том числе и для оптимальной системы коллективного стимулирования) существует система индивидуального стимулирования не меньшей эффективности. Следовательно, при решении задачи синтеза оптимального механизма стимулирования в модели S3 можно ограничиться классом индивидуальных систем стимулирования (то есть классом моделей типа S1).
Следует отметить, что выше мы не акцентировали внимание на том, что множество решений игры может содержать более одной точки - при фиксированной системе стимулирования может существовать несколько равновесий Нэша. Поэтому в случае множественности равновесий отдельного внимания заслуживает вопрос о том, что понимать под гипотезой благожелательности - выбор элементами равновесия, наиболее благоприятного с точки зрения центра (такому предположению в (3) и (7) соответствовала бы дополнительная минимизация по у е Р( )) из множества всех реализуемых действий, или из множества Парето эффективных реализуемых действий и т.д.
Также необходимо подчеркнуть, что приведенный выше результат об "эквивалентности" систем индивидуального и коллективного стимулирования (с точки зрения их потенциальной эффективности) справедлив лишь для случая сепарабельных затрат. Если индивидуальные затраты АЭ не сепарабельны (см. модель S4 ниже), то есть, если затраты каждого АЭ могут зависеть от действий всех элементов, то замены типа (10) оказывается недостаточно.
Построим оптимальную систему индивидуального стимулирования (которая в силу теоремы 4.3.1 будет оптимальна в модели S3). В теореме 4.3.1 для исходной системы стимулирования построена эквивалентная система индивидуального стимулирования. Использованная идея декомпозиции игры активных элементов позволяет найти систему стимулирования, оптимальную в модели S3. В частности, из индивидуальной рациональности АЭ (напомним, что свойство индивидуальной рациональности гласит, что выбираемое АЭ действие должно приводить к неотрицательным
42

значениями его функции полезности25) и свойств минимальных затрат на стимулирование, следует справедливость следующего утверждения.
Теорема 4.3.2. Класс систем стимулирования26 (с параметром
у*)
**
(12) оСу) =
Ci (Уг) + 5 г, у, = у, *
,0, у, ^ у,
реализует вектор действий у* е Л' как РДС и ^оптимален в модели S3. Более того, если 5i > 0, i е I, то у* - единственное РДС.
Единственность соответствующего РДС доказывается по аналогии с доказательством пункта в) теоремы 4.2.1.
Наличие единственного равновесия при использовании центром системы стимулирования (12) чрезвычайно привлекательно, так как при использовании исходной системы коллективного стимулирования в модели S3, множество равновесий может оказаться достаточно "большим", что требует от центра введения дополнительных гипотез о рациональном поведении АЭ.
Отметим, что (12) является не единственной оптимальной системой стимулирования - для оптимальности некоторой системы стимулирования в рассматриваемой модели достаточно, чтобы
стимулирование при у* ^ у* "убывало быстрее", чем затраты АЭ
(см. теорему 4.4.2 ниже).
Теорема 4.3.2 определяет параметрический класс оптимальных систем стимулирования. Оптимальное значение параметра ищется, как и ранее, как результат решения задачи оптимального согласованного планирования.
Пример 5. Рассмотрим АС с двумя АЭ, имеющими функции
затрат ci(yi) = у2 / 2ri. Пусть центр использует систему стимулиро-
, 'С,, У1 + У2 > x . , ,, вания оi(y/, у2) = < , i = 1, 2.
[0, У1 + У2 < x

Содержательно, центр выплачивает каждому АЭ фиксированное вознаграждение при условии, что сумма их действий оказывается не меньше, чем некоторое плановое значение x. Обозначим
yi+ = ,[2riC˜, i = 1, 2, Y = {(^1, у2) I у, < yi+, i = 1, 2, y/ + у2 ?x} -
множество индивидуально-рациональных действий АЭ. Рассмотрим четыре возможных комбинации переменных (см. рисунки 3а - 3г).
У2

Y
\n2
у1
у1
у+
В первом случае (см. Рис.3 a) множество равновесий Нэша составляет отрезок:
Е^(о) = [N/; N2]. Фиксируем
произвольное равновесие
* * *
у
У1
Рис.3 a
у = (У1, У2) е EN(о). Наличие "большого" равновесия Нэша (отрезка, содержащего континуум точек) имеет несколько минусов с точки зрения эффективности стимулирования.
Так как все точки отрезка [N/ N2] эффективны по Парето с точки зрения АЭ, то при определении эффективности системы стимулирования центр вынужден либо использовать гарантированный результат (вычислять минимум по этому отрезку), либо доплачивать АЭ за выбор конкретных действий из этого отрезка.
Построим систему индивидуального стимулирования в соответствии с выражением (10):
C2, У2 > у* *
0, У2 < у*
Cl, У1 > у*
(71 (y/)=о(y/, у*) =
* о ;(y2)=О( У1,У2)=
0, у1 < у1
*
При использовании этой системы стимулирования точка у = (у*, у *) оказывается единственным равновесием Нэша, то есть, переходя в соответствии с выражением (10) от системы стимулирования каждого АЭ, зависящей от действий всех АЭ, к системе стимулирования, зависящей только от его собственных действий, центр "декомпозирует" игру элементов, реализуя при этом единственное действие. При этом эффективность стимулирования, оче- 44 видно, не только не понижается, а может оказаться более высокой, чем при использовании исходной системы стимулирования (см. теорему 4.3.2).

У1


Рис.3 с
У1 >
Рис.3 b
Во втором и третьем случаях (см. Рис.3 b и Рис.3 с) равновесием Нэша являются отрезки [N/ N2], изображенные на соответствующих рисунках выше.

У1 У1 Рис.3 d
У1
И, наконец, в четвертом случае (см. Рис.3 d) множество равновесий Нэша состоит из точки (0; 0) и отрезка [N/ N2], то есть EN(о) = (0;0) и [N1 N2], причем точки интервала (N/ N2) являются недоминируемыми по Парето другими равновесиями, то есть:
(N1; N2) = Par (Е^{о), {fi}). •
Итак, мы доказали, что модель S3 эквивалентна гораздо более простой с точки зрения анализа и хорошо изученной модели S1.
Частными, но широко распространенными на практике, случаями модели S3 являются ранговые системы стимулирования, обозначенные выше S3R, в том числе нормативные и соревновательные. Эти системы стимулирования подробно рассматриваются ниже в пятом разделе настоящей работы.
45

4.4. МОДЕЛЬ S4: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ДЕЙСТВИЙ ВСЕХ АЭ, ЗАТРАТЫ НЕ СЕПАРАБЕЛЬНЫ
Запишем определение равновесия Нэша для рассматриваемой модели:
EN(о) = ^еЛ I V ieI, V уеЛ, Ог(yN)-Cг(yN) > Ог( у"!,, у)-с( у"!,, у,)}.
По аналогии с теоремой 4.3.1 можно доказать, что для любой системы коллективного стимулирования о(), реализующей вектор действий у* е Л' как равновесие Нэша, в модели S4 существует система индивидуального стимулирования отС ), определяемая следующим образом:
**
(1а) CГг (у , у,) =
Ог (у ), у, = у,
,0, у, ^ у**^
которая обладает не меньшей эффективностью, чем исходная. Поэтому перейдем сразу к построению оптимальной системы стимулирования.
Фиксируем у* е Л' и рассмотрим следующий класс систем стимулирования (с параметром у*):
(1в) О,^: у) = i0ii У*-y-i' + Si--^i = i е I.
I0. у, * у,
Теорема 4.4.1. При использовании центром системы стимулирования (1б) с 5* > 0 у е Ed(a). Если 5* > 0, i е I, то у - единственное РДС. Более того, система стимулирования (1б) ^оптимальна.
Доказательство. Теорема 4.4.1 доказывается по аналогии с теоремой 4.2.1а, поэтому ее доказательство приводится здесь, в основном, в методических целях.
То, что у е EN(a) следует из приведенного выше определения
равновесия Нэша для модели S4 и (1б). Поэтому докажем более
*
сильное свойство, а именно, что у - равновесие в доминантных стратегиях (РДС).
Запишем определение равновесияyd е Л' в доминантных стратегиях для рассматриваемой модели: V i е I Vу* е Л* V y-i е A-i
(2) Gii yd, y-i) - Ci( yd, y-i) > о,(у, y-i) - c,(y, y-i). 46

Подставим в (2) систему стимулирования (1б), а вместо стратегии y'f - стратегию у* . В силу неотрицательности затрат АЭ получаем, что у* - РДС.
Предположим, что $ у е Л у ^ у : у е Ed(о). Тогда $ i е I: y^ ^у* . Так как y^ - доминантная стратегия i-го АЭ, то Vy-i е Л.*,
V у, е Л, Ог( У', y-i) - Ci( У', y-i) > Ог(Уг, У-,) - Ciiy,, У-,). Подставляя
* ' с
систему стимулирования (1б) и у* = y^ , получим: С'Сy^, y-i) < - 5*,
что противоречит предположению А.3.
Система стимулирования (1 б) в рамках гипотезы благожелательности при 5i = 0, i е I, имеет не большие затраты на стимулирование по реализации действия у*, чем любая другая система стимулирования, реализующая это же действие, следовательно она оптимальна (по теореме о минимальных затратах на стимулирование [42]). Если 5* > 0, то система стимулирования (1б) гарантированно ^оптимальна (см. доказательство теоремы 4.2.2 и раздел
n
4.1), где: 5 = X5, . •
i=1
Система индивидуального стимулирования (1а), соответствующая системе коллективного стимулирования (1б), имеет вид:
* * *
<^l (у*, у*) = ^i-^-i' + 51 • ^i = i e I.
l0- y, * y,
Если в модели S4 центр использует систему индивидуального стимулирования (У^ (у*, у*), то получаем модель S2, поэтому в соответствии с теоремой 4.2.1 б, эта система стимулирования будет реализовывать вектор действий у* е Л' как равновесие Нэша. Для реализации этого вектора действий как единственного равновесия Нэша (РДС, единственного РДС, соответственно) нужно потребовать выполнения дополнительных условий (см. условия (2) и (3) в теореме 4.2.1 б).
Алгоритм решения задач стимулирования первого и второго рода для модели S4 совпадает с соответствующими алгоритмами для модели S2 и не приводится.
47
Во всех рассмотренных до сих пор задачах стимулирования (см. модели S1, S2, S3 и S4) оптимальными оказывались разрывные ("квазикомпенсаторные" - см. [15, 16, 44]) функции стимулирования: активному элементу компенсировались затраты при выборе им определенного действия (при тех или иных предположениях об обстановке игры), в остальных случаях вознаграждение равнялось нулю. Рассмотрим, насколько изменятся полученные результаты, если потребовать, чтобы функции стимулирования были непрерывными. Интуитивно понятно, что если стимулирование будет в окрестности реализуемого действия изменяться быстрее, чем затраты, то все результаты останутся в силе. Приведем формальный результат для одного из возможных случаев.
Пусть в модели S4 функции затрат АЭ непрерывны по всем переменным, а множества возможных действий АЭ компактны. Рассмотрим непрерывные функции стимулирования следующего вида
(3) о(у)*= Ci(y) qi(y-, у),
где qi(yi, у) - непрерывная функция своих переменных, удовлетворяющая следующему условию:
(4) Vi е I V у, е Л, V у-, е Л-, qiiyi', у) < 1, qiiyi', у**, у-*) = 1. Теорема 4.4.2. Если выполнена гипотеза благожелательности,
то при использовании в модели S4 центром системы стимулирования (3)-(4) у* е Ed(a). *
Доказательство. Выбирая действие у* , независимо от обстановки игры, i-ый АЭ получает нулевой выигрыш. Выбирая любое другое действие, он при любой обстановке (в силу условия (4) выполнено: Vу* е Л* Vу.* е Л-* (qiiiy**, у) - 1)с(у) < 0) получает неположительный выигрыш. •
Отметим, что функция-"индикатор" qi( ) может зависеть от
действий i-го АЭ, например - qi(yi*, у*) = e У1 ˜У1 и т.д.
Содержательные интерпретации конструкций типа (3)-(4) очевидны. Аналогичным образом строятся непрерывные оптимальные системы стимулирования и в других моделях.
Рассмотрим пример, иллюстрирующий результат теоремы 4.4.1.
48
Пример 6. Пусть в условиях примера 5, рассмотренном в разделе 4.3, функции затрат АЭ несепарабельны и имеют вид:
_(у, + а у-i)2
Ci(y) =
2^.
. Определим множество Y индивидуально-
рациональных действий: Y = {(y/, у2) | ciy) < С*, i =1, 2}. Для того, чтобы не рассматривать все возможные комбинации значений параметров {r/, r2, C/, С2, x} возьмем случай, представленный на рисунке 4.
у2
y2
]



у1

--^ >
V2rC1/а

у* V^rQ x V^rC^/а
Рис. 4. Множество равновесий Нэша в примере 6.
В рассматриваемом случае множество равновесий Нэша включает отрезок [N/ N2]. Система стимулирования
С2(У1, у*), У2 = у* *
0• У2 * у*
С1( Уь У2)• У1 = у*
(7l(y) =
* s 2* (у) =
0, у1 * у1
реализует действие у* е [N/ N2] как единственное равновесие в доминантных стратегиях.
7*
Система стимулирования О имеет эффективность не меньшую, чем исходная система стимулирования с теми же параметрами C/ и C2 (см. пример 5). Она в точности компенсирует затраты АЭ, а исходная "переплачивала" следующую величину: DC = C/ - c/(y*) + C2 - с2(у*), которая неотрицательна в силу индивидуальной рациональности активных элементов. •
49

4.5. МОДЕЛЬ S5: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ РЕЗУЛЬТАТА ДЕЯТЕЛЬНОСТИ АС, ЗАТРАТЫ СЕПАРАБЕЛЬНЫ
Пусть результат деятельности27 z е Л0 = Л активной системы, состоящей из n АЭ, является функцией их действий: z = Q(y).
Предположим, что стимулирование i-го АЭ есть о*: Л0 (r) , i е I. Равновесный по Нэшу вектор действий АЭ У определяется следующим образом:
V i е I V у, е Л, GiiQiy^)) - Ci( yf) > GiiQiyi, у)) - с,(у). В случае, когда индивидуальные действия АЭ наблюдаемы для центра (или когда центр может однозначно восстановить их по наблюдаемому результату деятельности), последний может использовать систему стимулирования, зависящую непосредственно от действий АЭ: V i е I оу* (у) = оi(Q(y))• то есть получаем модель
S3, для которой выше было доказано, что она эквивалентна модели S1 (напомним, что переход от S3 к S1 осуществляется следующим
образом: V i е I От * (у*) = От* (у* *, у*)), методы исследования которой хорошо известны и описаны выше и в [15, 44]. Поэтому рассмотрим случай, когда центр наблюдает только результат деятельности коллектива элементов, от которого зависит его доход, то есть H: Л0 (r) но не знает и не может восстановить их индивидуальных действий.
Отметим, что в рассмотренных выше моделях S1-S4 декомпозиция игры активных элементов основывалась на возможности центра поощрять АЭ за выбор определенного (и наблюдаемого центром) действия. Если действия АЭ ненаблюдаемы, то непосредственное применение идеи декомпозиции невозможно, поэтому при решении задач стимулирования, в которых вознаграждение АЭ зависит от агрегированного28 результата деятельности АС, следует использовать следующий подход - найти множество действий, приводящих к заданному результату деятельности, выделить среди них подмножество, характеризуемое минимальными суммарными затратами АЭ (и, следовательно, минимальными затратами центра на стимулирование при использовании компенсаторных функций стимулирования), построить систему стимулирования, реализующую это подмножество действий, а затем определить - реализация какого из результатов деятельности наиболее выгодна для центра.
Функция дохода центра может зависеть как от действий АЭ, так и от результата деятельности АС. Действия АЭ при этом могут быть наблюдаемы или ненаблюдаемы. Таким образом, получаем следующие четыре возможных варианта (комбинации).
Вариант 1. Действия АЭ наблюдаемы, функция дохода центра зависит от действий АЭ. В этом случае получаем модель S1 или модель S3, причем последняя (как было доказано в разделе 4.3) "эквивалентна" модели S1.
Вариант 2. Действия АЭ наблюдаемы, функция дохода центра зависит только от результата деятельности АС. В этом случае, обозначая H (у) = H(Q(y)), получаем модель S1 или модель S3 (в зависимости от переменных, от которых зависит вознаграждение АЭ), где целевая функция центра равна Ф(у) = H (у) - д{у). Методы решения этого класса задач описаны выше в разделах 4.1 и 4.3.
Вариант 3. Действия активных элементов ненаблюдаемы, а наблюдаем только результат деятельности активной системы в целом, при этом функция дохода центра зависит от действий АЭ. Подробно данный вариант рассматривается ниже в разделе 4.7.
Вариант 4. Действия активных элементов ненаблюдаемы, а наблюдаем только результат деятельности активной системы в целом, при этом и функция дохода центра, и вознаграждения АЭ зависят от результата деятельности АС.
Рассмотрим подробно четвертый вариант. Для решения соответствующей задачи стимулирования может быть использован подход, предложенный в [18, 36] и развиваемый ниже.
Определим Y(z) = {у е Л' | Q(y) = z} с Л', z е Л0. Содержательно Y(z) - множество тех действий АЭ, выбор которых приводит к реализации заданного результата их деятельности z е Л0. При компенсации центром затрат активных элементов минимальные затраты на стимулирование по реализации результата деятельности
n
z е Л0 равны: J(z) = min X Ciiy*), а целевая функция центра
yeY(z) i=1
равна: F(z) = H(z) - J(z).
На первом шаге решения задачи стимулирования определим множество векторов действий АЭ, приводящих к заданному результату деятельности и требующих минимальных затрат на сти-
n
мулирование по своей реализации: Y*(z) = Arg min X С.СУ*).
y^Y (z) i=1
Фиксируем произвольный вектор у (x) е Y (x) c' Y(x), x e Л0.
Теорема 4.5.1. При использовании центром системы стимулирования
(ио;(x. z) = 1С1(y¦;ix)), ^ = i е
10, z * x
где x е Л0 - параметр (план), множество равновесий Нэша есть Е^{о) = Y (x), причем система стимулирования (1) реализует результат деятельности x е Л0 с минимальными суммарными затратами центра на стимулирование.
Доказательство. Так как y(x)eY(x), то у (x) е Par(Y(x),{- С'С )}). Фиксируем произвольный номер i е I. При фиксированной обстановке игры выбор действия у* е Proj* Y(x): у* > у* невыгоден для i-го АЭ, так как при этом его затраты не убывают, а стимули-
52
рование не изменяется. Выбор действия у* < у* для него также
невыгоден, так как при этом его затраты убывают, но и стимулирование становится равным нулю (если бы существовало действие i-
го АЭ, приводящее к тому же результату деятельности и характе-
*
ризуемое строго меньшими его затратами, чем y^ , то оно было бы включено центром во множество Y*(x)). Следовательно, y*(x) - равновесие Нэша. •
Отметим, что при доказательстве теоремы 4.5.1 практически не использовалась сепарабельность затрат активных элементов.
Недостатком системы стимулирования (1) является то, что при ее использовании центром, помимо определяемого теоремой 4.5.1 множества равновесий Нэша, существует РДС - вектор нулевых действий. Для того чтобы точки множества Y*(x) были единственными равновесными точками, центр должен за их выбор доплачивать АЭ сколь угодно малую, но положительную, величину. Поэтому система стимулирования (1) в общем случае является e- оптимальной.
На втором шаге решения задачи стимулирования найдем наиболее выгодный для центра результат деятельности коллектива АЭ x* е Л0 как решение задачи оптимального согласованного планирования: x* = arg max [H(z) - J(z)], то есть эффективность стимули-
zeA0
рования Ks5 равна Kss = Fix*), где F(z) = H(z) - J(z).
Отметим, что при использовании предложенного подхода для модели S5 существенно предположение о бескоалиционности игры АЭ, так как для некоторой коалиции (но не максимальной коалиции!) могут существовать вектора действий, доминирующие по Парето вычисленное выше равновесие Нэша, но, действуя некооперативно, попасть в точку Парето АЭ не могут. Однако, несмотря на то, что в рассматриваемой модели в общем случае существует несколько равновесий Нэша (доплата за их выбор по сравнению с нулевым действием не всегда выделяет, как это было в моделях S2- S4, единственное равновесие), при определении эффективности стимулирования центру не следует брать гарантированный результат по Y*(x) множеству, так как все точки этого множества для него эквивалентны - все они требуют для своей реализации одинаковых
53
затрат на стимулирование.
Рассмотрим теперь класс US5 унифицированных систем стимулирования в АС с коллективным стимулированием и сепара- бельными затратами. Если индивидуальные действия АЭ наблюдаются или однозначно восстанавливаются центром, то, как отмечалось выше, получаем модель US3, от которой можно перейти к US1. Поэтому предположим, что индивидуальные действия ненаблюдаемы для центра.
Обозначим с(у) = max {С.СУ,)}, С: Л' (r) . Вычислим мини-
ieI
мальные затраты на стимулирование по реализации результата деятельности z е Л0: du(z) = min с(у) (так как центр использует
уеТ(z)
унифицированную систему стимулирования, то для того, чтобы побудить АЭ выбрать некоторый вектор действий у е Y(z), он должен компенсировать затраты по выбору соответствующих компонент этого вектора всем АЭ).
Множество векторов действий, на которых достигается минимум затрат на стимулирование по реализации результата деятельности z е Л0, определяется как: Y*(z) = Arg min с(у). Унифициро-
y^Y (z)
ванная система стимулирования:
o(x. z) = x)), = x, i e I,
0, z * x
где y*(x) - произвольный элемент множества Y*(x), реализует результат деятельности x е Л0 с минимальными затратами на стиму- лирование29. Отметим, что при этом может оказаться, что EN(О) с Y (x), то есть не всякий элемент у (x) множества Y (x) есть равновесие Нэша (в отличие от персонифицированного стимулирования - см. теорему 4.5.1). С точки зрения эффективности стимулирования этот факт не имеет значения, так как суммарные затраты центра на стимулирование одинаковы на всем множестве Y (x).
На втором шаге решения задачи синтеза оптимальной унифицированной системы коллективного стимулирования найдем наиболее выгодный для центра результат деятельности коллектива АЭ *
xu как решение задачи оптимального согласованного планирования: x* = arg max [H(z) - Ju(z)], то есть Kus5 = Ф( x*). zeA)
Потери центра от использования унифицированного стимулирования по сравнению с персонифицированным стимулированием в модели S5 зависят от минимальных затрат на стимулирование:
A(S5, US5) = Ks5 - Kus5 = max [H(z) - J(z)] - max [H(z) - Ju(z)].
zeЛo zeA0
Рассмотрим пример, иллюстрирующий использование предложенного подхода к решению задач стимулирования в моделях типа S5.
n2 Пример 7. Пусть z = X У* , H(z) = z, С.СУ*) = у* /2ri, i e I. При
i=1
n
этом Y(z) = {y e Л' | X У* = z}. Решение задачи
i=1
n
X ci (y,) (r) niin
i=1 УеЛ
n * ri n
при условии X у* = x имеет вид: у* (x) = ^^ x, где W = X r* , i е I.
i=1 i=1 Минимальные затраты на стимулирование по реализации результата деятельности x е Л0 равны J(x) = x /2W. Вычисляя максимум целевой функции центра: max [H(x) - J(x)], находим оптимальный
x>0
план: x* = W и оптимальную систему стимулирования:
2
x
r т, z = x
О, (W, z) =
, i e I.
0, z * x
При этом эффективность стимулирования (значение целевой функции центра) равна KS5 = W / 2.
55
Пусть теперь в рамках рассматриваемого примера центр должен использовать унифицированную систему стимулирования.
Определим с(у) = у2/2rj, где j = arg min {r*}. Тогда минимальные
ieI
затраты на стимулирование равны Ju(z) = z2 / 2nrj. Оптимальный
план x* = n rj дает значение эффективности Kus5 = n rj / 2. Видно,
что Kus5 < KS5, причем равенство имеет место в случае одинаковых активных элементов. •
4.6. МОДЕЛЬ S6: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ РЕЗУЛЬТАТА ДЕЯТЕЛЬНОСТИ АС, ЗАТРАТЫ НЕ СЕПАРАБЕЛЬНЫ
Модель S6, в которой при несепарабельных затратах активных элементов их индивидуальные вознаграждения зависят только от результата их деятельности, чрезвычайно близка (с точки зрения подходов и результатов решения задачи стимулирования) к модели S5, отличающейся лишь сепарабельностью затрат.
Действительно, если действия активных элементов наблюдаются или могут быть однозначно восстановлены центром, то модель S6 переходит в модель S4, рассмотренную выше в разделе 4.4. Если действия АЭ ненаблюдаемы, то используем подход, предложенный в разделе 4.5, то есть определим для каждого результата деятельности множество действий, приводящих к его реализации, вычислим минимальные затраты и т.д. Опишем эту последовательность формально.
Равновесный по Нэшу вектор действий АЭ У определяется следующим образом:
V i е I Vу, е Л, Ог(Q(yN)) - с,(У^) > oiQ(y, у-i)) - с,(у, у-i).
Определим Y(z) = {у е Л' | Q(y) = z} с Л', z е Л0. При компенсации центром затрат активных элементов минимальные затраты на стимулирование по реализации результата деятельности z е Л0
n
равны: J(z) = min X С.СУ).
yer (z) ^
56
На первом шаге решения задачи стимулирования определим множество векторов действий АЭ, приводящих к заданному результату деятельности и требующих минимальных затрат на сти-
n
мулирование по своей реализации: Y*(z) = Arg min X Ci(y).
Уer(z) i=1
Фиксируем произвольный вектор у (z) е Y (z) с Y(z).
Теорема 4.6.1. Если VxeA0 VyieProji Y(x) Vj^i Vy_ieProj-i Y(x) Cj(yi, y-i) не возрастает по у*, то при использовании центром системы стимулирования
/01 о% л Ic, (у *(x)), z = x , (2) о i (x, z) = \ , i e I,
[0, z * x
где x е Л0 - параметр (план), результат деятельности x е Л0 реализуется с минимальными затратами центра на стимулирование.
Доказательство теоремы 4.6.1 повторяет доказательство теоремы 4.5.1 и не приводится.
На втором шаге решения задачи стимулирования найдем наиболее выгодный для центра результат деятельности коллектива АЭ *
x е Л0 как решение задачи оптимального согласованного планирования: x* = arg max [H(z) - J(z)].
zeA0
Рассмотрим теперь класс US6 унифицированных систем стимулирования в АС с коллективным стимулированием и несепара- бельными затратами. Если индивидуальные действия АЭ наблюдаются или однозначно восстанавливаются центром, то, как отмечалось выше, получаем модель US4, от которой можно перейти к US1 (см. раздел 4.4). Поэтому предположим, что индивидуальные действия ненаблюдаемы для центра.
Обозначим С: Л' (r)
(2) с(у) = max {ci(y)}.
ieI
Вычислим минимальные затраты на стимулирование по реализации результата деятельности z е Л0: Ju(z) = n min с(у). Вектор
yeY (z)
действий, минимизирующий затраты на стимулирование по реализации результата деятельности z е Л0, определяется следующим
57
выражением: Y*(z) = Arg min c(y). Унифицированная система
yeY(z)
стимулирования:
(3) Ог(x, z) = IC(x)), z = x, i e I, 0, z * x
где у (x) - произвольный элемент множества Y (x), реализует результат деятельности x е Л0 с минимальными затратами на стимулирование (как и в разделе 4.5, для того чтобы исключить выбор АЭ нулевых действий при использовании унифицированных систем стимулирования центру следует доплачивать за выбор ненулевых действий строго положительную величину АЭ из множества Arg max {Ci(y)}).
ieI
На втором шаге решения задачи синтеза оптимальной унифицированной коллективной системы стимулирования найдем наиболее выгодный для центра результат деятельности коллектива АЭ
xu как решение задачи оптимального согласованного планирования: x* = arg max [H(z) - tfu(z)].
zeA0
Теорема 4.6.2. В модели S6 эффективность унифицированного стимулирования не выше, чем эффективность персонифицированного стимулирования.
Доказательство. Фиксируем произвольный результат деятельности. Реализующая его унифицированная система стимулирования (3) в силу (2) характеризуется не меньшими суммарными затратами на стимулирование со стороны центра, чем система персонифицированная стимулирования (1). По теореме о минимальных затратах на стимулирование получаем, что K^e > KuSg. •
Потери центра от использования унифицированного стимулирования по сравнению с персонифицированным стимулированием в модели S6 зависят от минимальных затрат на стимулирование:
A(S6,uS6) = Ks6 - Kus6 = max [H(z) - J(z)] - max [H(z) - Ju(z)].
zeA0 zeA0
Рассмотрим пример, иллюстрирующий использование предложенного подхода к решению задач стимулирования в моделях типа S6.
58
Пример 8. Пусть в АС, состоящей из n = 2 АЭ функции затрат
(у, + a у_-)2
АЭ несепарабельны и имеют вид: С.СУ) = -^ ^-, i = 1, 2.
2ri
n
Если z = Q(y) = y/ + у2, то Y(z) = {у е Л' | X У* = z}. Решение
i=1
nn
задачи X С.СУ) (r) min при условии X У* = x имеет вид:
i=1 УеЛ' i=1
у * (x) = (ri _ a r-i) x yi (x) (1-a)W X,
где W = r/ + r2. Минимальные затраты на стимулирование по реализации результата деятельности x е Л0 равны J(x) = x2(1 + a2)/2W. Вычисляя максимум целевой функции центра: max [H(x) - J(x)],
x>0
находим оптимальный план: x = W/ (1 + a2) и оптимальную систему стимулирования:
2
x
ri 1W(/ + ^ z = x;, i = 1, 2. 0, z * x*
При этом эффективность стимулирования (значение целевой функции центра) равна KS6 = W/2(1 + a)2. •
о, (W, z) =
4.7. МОДЕЛИ S7 И S8: СТИМУЛИРОВАНИЕ АЭ ЗАВИСИТ ОТ ДЕЙСТВИЙ АЭ И РЕЗУЛЬТАТА ДЕЯТЕЛЬНОСТИ АС, ЗАТРАТЫ СЕПАРАБЕЛЬНЫ ИЛИ НЕСЕПАРАБЕЛЬНЫ
Стимулирование конкретного активного элемента может основываться непосредственно на его действии и/или действиях других АЭ только в том случае, если эти действия наблюдаются центром. Если действия наблюдаемы, то, как показано в разделах 4.5 и 4.6, стимулирование на основании результата деятельности не повышает эффективности управления30.
Если же действия ненаблюдаемы, но наблюдаем агрегированный результат деятельности, то стимулирование активного элемента непосредственно на основании его индивидуальных действий или действий остальных АЭ невозможно. Поэтому модели S7 и S8 в некотором смысле внутренне противоречивы. Если действия всех АЭ наблюдаемы, то модель S7 переходит в модель S3 (а модель S8
- в модель S4). Если действия ненаблюдаемы, то модель S7 переходит в модель S5 (а модель S8 - в модель S6).
Здесь же (при обсуждении моделей S7 и S8) уместно сравнить оценки эффективности индивидуального и коллективного стимулирования. Представим себе следующую ситуацию. Пусть центр должен стимулировать АЭ на основании скалярного (агрегированного) результата деятельности коллектива АЭ.
Если выбор процедуры агрегирования, то есть отображения Q: Л' (r)Л0, является прерогативой центра, то задача заключается в определении оптимальной (в рамках имеющейся у центра информации) процедуры агрегирования, то есть процедуры, при использовании которой потери в эффективности были бы минимальны по сравнению со случаем полностью наблюдаемых действий АЭ и использования центром индивидуального стимулирования.
Рассмотрим следующую модель. Пусть выполнено предположение
А5. Л' и Л0 с ^^ - компактные множества; Q: Л' (r) Л0 - непрерывное однозначное отображение, такое что: V z е Л0 $ у е Л': Q(y) = z и Vy е Л' Q(y) е Л0.
Пусть функция дохода центра - H(z), то есть зависит от результата деятельности АС. Рассмотрим два случая. Первый случай
- когда действия АЭ наблюдаемы, и центр может основывать стимулирование как на действиях АЭ, так и на результате деятельности. Второй случай, когда действия АЭ ненаблюдаемы, и стимулирование может зависеть только от наблюдаемого результата деятельности. Сравним эффективности стимулирования для этих двух случаев.
В первом случае минимальные затраты на стимулирование равны (в общем случае будем считать, что затраты несепарабельны
60 - ср. модели S2 и S4): J/(y) = X Ci(y), а эффективность стимули-
i=1
рования равна: K/ = max {H(Q(y)) - J/(y)}.
yeA
Во втором случае минимальные затраты центра на стимулирование по реализации результата деятельности z е Л0 определяются
n
следующим образом: J2(z) = min X С'СУ), а эффективность
yeY (z) i=1
стимулирования равна K2 = max {H(z) - J2(z)}.
ze Л0
Теорема 4.7.1. Если выполнено предположение А.5, то K2 = K/. Доказательство. Пусть K/ < K2, тогда V у е Л' выполнено:
(1) H(Q(y)) - X Ci(y) < H(x) - min X Ci(y),
i=1 Уer(x) i=1
где x = arg max {H(z) - J2(z)}. Выбирая в левой части выражения
ze Л0
nn
(1) у = y*(x) е Y*(x), получим: X ci(y*(x)) > min X С.СУ) - про-
i=1 Уer (x) i=1
тиворечие в силу определений множеств Y(x) и Y (x). Пусть K/ > K2, тогда V z е Л0 выполнено:
(2) {HiQiy*)) - X Ciiy*)} > H(z) - min X c,(y),
i=1 Уer (z) i=1
где у* = arg max {H(Q(y)) - J/(y)}. Выбирая в правой части выра-
yeA
жения (2) результат деятельности z равным x = Q(y*), получим:
nn
X С'СУ*) < min X С'СУ) - противоречие в силу того, что
i=1 Уer (x) i=1
*
у е Y(x). •
Теорема 4.7.1 (которую условно можно назвать "теоремой об идеальном агрегировании в моделях S5 - S8"), помимо оценок сравнительной эффективности имеет чрезвычайно важное методологическое значение. Она утверждает, что в случае, когда функция дохода центра зависит только от результата деятельности АС, эффективности стимулирования одинаковы как при использовании
61
стимулирования АЭ за наблюдаемые действия, так и при стимулировании за агрегированный результат деятельности, несущий в силу предположения А.5 меньшую информацию, чем вектор действий АЭ.
Другими словами, наличие агрегирования информации не снижает эффективности функционирования системы. Это достаточно парадоксально, так как в [36] доказано, что наличие агрегирования в задачах стимулирования не повышает эффективности. В рассматриваемой модели присутствует идеальное агрегирование (см. определение и подробное обсуждение проблем агрегирования в управлении активными системами в [36]), возможность осуществления которого содержательно обусловлена тем, что центру неважно какие действия предпринимают АЭ, лишь бы эти действия приводили с минимальными суммарными затратами к заданному результату деятельности. Условия А.5 (которое трудно назвать обременительным) оказывается достаточно для того, чтобы центр мог переложить все "проблемы" по определению равновесия на активные элементы. При этом уменьшается информационная нагрузка на центр, а эффективность стимулирования остается такой же.
Итак, качественный вывод из результата теоремы 4.7.1 следующий: если в условиях полной информированности доход центра зависит от агрегированных показателей деятельности активных элементов, то целесообразно основывать стимулирование АЭ на этих агрегированных показателях. Даже если индивидуальные действия АЭ наблюдаются центром, то использование системы стимулирования, основывающейся на действиях АЭ, не приведет к увеличению эффективности управления, а лишь увеличит информационную нагрузку на центр.
Сложнее дело обстоит, когда функция дохода центра зависит от действий АЭ, которые не наблюдаемы - см. третий вариант в разделе 4.5 (в противном случае мы получили бы модель S4).
Фиксируем вектор у (x) е Y (x) и предположим, что центр использует систему стимулирования
o;(x, z) = |Ci(Уx)), z = x, i e I.
[ 0, z * x
62
Эта система стимулирования реализует результат деятельности x е Л0. При этом, однако, может оказаться, что выбранные АЭ действия, которые обязательно принадлежат множеству Y (x), не равны у (x). Центр не вправе рассчитывать на выполнение "гипотезы благожелательности31", в рамках которой выполнено:
n
Ks = max max {H(y) - X С.СУ)}, а вынужден определять макси-
zeA0 yeY(z) i=1
мальную эффективность стимулирования как32: (4) K4 = max { min H(y) - J2(z)}.
zeA0 yer*(z)
Напомним, что при классификации задач стимулирования в многоэлементных активных системах мы ограничились случаем, когда для всех АЭ используется система стимулирования одного типа. В том числе это предположение означает, что, если действия наблюдаемы, то они наблюдаемы центром у всех АЭ, а если нена- блюдаемы, то, опять же, у всех АЭ.
На практике часто встречаются ситуации, когда, например, в рамках модели S7 или S8 действия одних элементов наблюдаемы, а других - нет33. В подобных случаях центру следует использовать комбинацию моделей S1-S6: тех АЭ, действия которых наблюдаемы стимулировать на основании их действий, а остальных - на основании агрегированного результата деятельности. Рассмотрим формальную модель.
Пусть в активной системе, состоящей из n активных элементов, действия АЭ из множества J с I наблюдаются центром, а действия АЭ из множества I \ J ненаблюдаемы для центра. Обозначим: AJ = ^ Л^, yJ - вектор действий АЭ из множества J,
ieJ
Aj\j= ^ Л*, yj\J - вектор действий АЭ из множества I \ J, у = (yJ,
ieI \ J
yj<J) е Л'. Предположим, что:
1) результат деятельности АС зависит от действий всех АЭ;
2) доход центра зависит от наблюдаемых действий АЭ и результата деятельности АС, то есть H = H(yJ, z);
3) целевая функция центра равна: FiyJ, z) = H(yJ, z) - JiyJ, z), где J(yJ, z) определяется ниже, у e Еи(о), о е M;
4) затраты несепарабельны, то есть затраты каждого АЭ зависят от действий всех АЭ: с* = С.СУ), i е I;
5) стимулирование АЭ, действия которых наблюдаемы, зависит от их действий, то есть о* = О1(УУ), i е J (делать их стимулирование зависящим от действий yi\J и/или результата деятельности АС бессмысленно - см. результаты выше);
6) стимулирование АЭ, действия которых ненаблюдаемы, зависит от результата деятельности АС, то есть о* = oi(z), i е I\J.
Обозначим: A0(yJ) = {z е Л0 | z =Q(yJ, yI\J), yj^J e Л/и} с Л0 - множество результатов деятельности, которые могут быть получены при условии, что АЭ из множества J выбрали действия yJ е AJ; Y(z, yJ) = {yI\J e ANJ | Q(yJ, yzu) = z} ^ ANJ, z e A0(yJ), yJ e AJ - множество тех действий АЭ из множества выбор которых при условии, что остальные АЭ выбрали действия yJ, приводит к реализации заданного результата деятельности z е Л0.
Пусть АЭ из множества J выбрали вектор действий yJ. При компенсации центром затрат активных элементов его минимальные затраты на стимулирование по реализации результата деятельности z е A0(yj) равны: J{yJ, z) = min X ci(yi\J, yJ).
УХ\J eY(z,yJ) ieI
На первом шаге решения задачи стимулирования определим множество векторов действий АЭ, приводящих к заданному результату деятельности и требующих минимальных затрат на стимулирование по своей реализации: 64
Y*'(z, yJ) = Arg min X Ciiym, yJ) с Y(z, yJ).
yj\J er (z• yJ) ieI
Фиксируем произвольный вектор у*\J (z) e Y*(z, yj) с Y(z, yJ). Теорема 4.7.2. Система стимулирования34
(5) О:(x, z) = |Ci(y*, y*\J (x)), z = x, i e lU, 0, z * x
(6) оi(y*, yJ) =
Ci (Уг*• yJ\{г}• y*\J (x))• y, = y* * e J,
0• y, * y* '
реализует как равновесие Нэша: действие у* eAJ и результат
деятельности xeA0 с минимальными затратами на стимулирование.
Доказательство теоремы 4.7.2 является комбинацией доказательств теорем 4.4.1 и 4.5.1 и не приводится.
Пример 9. Пусть в АС, состоящей из n = 3 АЭ, функции затрат
АЭ сепарабельны и имеют вид: ci(y) = yi /2ri, iel; J={1}, I^\J={1;2};
n
z = y/ + y2 + y3; H(z) = z. Y(z) = {y e Л' | X У* = z}. Решение зада-
i=1
чи X С'СУ*) ^ min при условии X У* = x - X У* дает мно-
ieI\J y^^J\J ieI\J ieJ
жество Y*\J (yJ, z) = {y* = ^^^ (z - X У,), * e I\J}.
X rj ieJ
jel \ J
Минимальные затраты на стимулирование по реализации дей-
*
ствия у1 и результата деятельности x е Л0 равны:
y*, x) = (xz.y*)! + (лЦ.
2(Г2 + Г3) 2r,
Целевая функция центра равна: Ф( у*, x) = x - у*, x). Опти-
мальные значения параметров равны: x = W = r/ + r2 + r3 (ср. с оптимальными решениями в примерах 2, 4, 7 и 8). •
На втором этапе решения задачи стимулирования определяются значения параметров yJ е AJ, x е Л0 систем стимулирования (5)- (6), которые максимизируют эффективность:
K* = max {H(yJ, x) - J(yJ, x)}.
yJ eAJ, xeA0
Итак, мы рассмотрели один из возможных случаев наблюдаемости действий АЭ и результатов деятельности АС (см. шесть предположений в настоящем разделе выше). Другие комбинации рассматриваются по аналогии. Ключевой идеей при этом является адаптированное использование результатов исследования моделей S1-S6, то есть на первом этапе - декомпозиция игры активных элементов и компенсация их затрат по выбору фиксированных действий, затем на втором этапе - выбор оптимального с точки зрения центра реализуемого действия.
Таким образом, основной методологический вывод из результатов исследования задач стимулирования в детерминированных многоэлементных АС, рассмотренных в настоящем разделе, заключается в следующем: решение задачи стимулирования в многоэлементных АС опирается на две ключевых идеи - декомпозиции игры активных элементов и компенсации их затрат.
Отметим, что первая идея является специфической для многоэлементных АС, а вторая справедлива как для одноэлементных, так и для многоэлементных активных систем (см. выше). Возможность декомпозиции игры АЭ основана на использовании центром систем стимулирования, при которых у каждого АЭ существует единственная доминантная стратегия. Более того, оказывается, что системы стимулирования, декомпозирующие игру АЭ, характеризуются минимальными затратами центра на стимулирование, то есть оптимальны или е-оптимальны. Описанная в настоящем разделе для детерминированных моделей многоэлементных АС методология и методика решения задач стимулирования в седьмом разделе настоящей работы обобщается на случай многоэлементных АС с неопределенностью, а в пятом, шестом, восьмом, девятом и десятом разделах используется при рассмотрении практически важных прикладных задач стимулирования.
66
5. РАНГОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ35
В большинстве рассмотренных выше моделей вознаграждение АЭ зависело от абсолютных значений их действий и/или результата деятельности. В то же время на практике достаточно распространены ранговые системы стимулирования (РСС), в которых величина вознаграждения АЭ определяется либо принадлежностью показателя его деятельности некоторому наперед заданному множеству - так называемые нормативные РСС, либо местом, занимаемым АЭ в упорядочении показателей деятельности всех элементов - так называемые соревновательные РСС. Преимущества ранговых систем стимулирования достаточно очевидны - при их использовании центру иногда не обязательно знать достоверно значения всех действий, выбранных элементами; при использовании соревновательных РСС в АС, функционирующих в условиях неопределенности, в ряде случаев оказывается возможным снижение неопределенности за счет параллельного функционирования элементов и т.д. [7, 44].
Подробный обзор результатов отечественных и зарубежных авторов по исследованию РСС (турниров - rank-order tournaments - в терминологии теории контрактов) приведен в [34]. В настоящей работе нас будет интересовать следующий аспект: так как РСС являются подклассом систем стимулирования, то возникает вопрос - какова их эффективность в сравнении с другими системами стимулирования. Другими словами, в каких случаях использование РСС не приводит к потерям эффективности управления (стимулирования), а если приводит, то какова величина этих потерь?
5.1. НОРМАТИВНЫЕ РАНГОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ
Нормативные РСС характеризуются наличием процедур присвоения рангов АЭ в зависимости от показателей их деятельности (выбираемых действий и т.д.). Введем следующие предположения, которые будем считать выполненными на протяжении настоящего раздела.
А.5.1. Множества возможных действий АЭ одинаковы: Л* = Л = i е I.
А.5.2. Функции затрат АЭ монотонны.
А.5.3. Затраты от выбора нулевого действия равны нулю.
Пусть 3={1,2,...m} - множество возможных рангов, где m - размерность НРСС, {qj}, j= 1, m - совокупность m неотрицательных чисел, соответствующих вознаграждениям за "попадание" в различные ранги; S^*: Л*(r)^, i=1, n - процедуры классификации. Нормативной ранговой системой стимулирования (НРСС) называется кортеж {m, 5, {qj}}.
В работе [55] доказано, что для любой системы стимулирования существует НРСС не меньшей эффективности. Идея доказательства этого факта заключается в следующем. Пусть имеется произвольная допустимая система стимулирования, которая реализует некоторый вектор действий АЭ с некоторыми суммарными затратами на стимулирование. Легко показать, что, можно подобрать вектор вознаграждений q=(q/, q2, ¦¦¦, qm) и совокупность процедур классификации {Si} - в общем случае различных для различных АЭ, таких, что соответствующая НРСС будет реализовывать тот же вектор действий с теми же затратами на стимулирование, что и исходная система стимулирования (см. детали в [55]). Ключевым при этом является то, что процедуры Si( ) классификаций показателей деятельности АЭ могут быть различны.
То, что центр использует различные процедуры присвоения рангов, может показаться не "справедливым" с точки зрения АЭ. Действительно, например, выбирая одинаковые действия, два АЭ могут иметь различные ранги и, следовательно, получать различные вознаграждения. Более "справедливой" представляется НРСС, в которой процедура классификации одинакова для всех АЭ, то есть так называемая универсальная НРСС, при использовании которой элементы, выбравшие одинаковые действия, получают одинаковые вознаграждения.
68

Введем вектор Y = (Y/, Y2, ¦¦¦, Ym), такой, что 0 ? Y/ ? Y2 ? ? Ym < +?, который определяет некоторое разбиение множества Л. Универсальная НРСС задается кортежем {m, {Yj}, {qj}}, причем вознаграждение i-го активного элемента о* определяется следую-
m
щим образом: oi(yi) = X qj I(yie[Yj,Yj+)), где I() - функция-
j=0
индикатор, Y0 = 0, q0 = 0. Универсальная НРСС называется прогрессивной, если q0 ? q/ ? q2 ? ¦¦¦ ? qm. Пример прогрессивной универсальной НРСС приведен на рисунке 5.
m
q
q2 q1
у
0
3
m
Y2
Рис. 5. Пример прогрессивной универсальной НРСС.
Универсальная нормативная ранговая система стимулирования (УНРСС) принадлежит к классу унифицированных кусочно- постоянных систем стимулирования (см. классификацию выше). Исследуем ее эффективность.
Так как УНРСС кусочно-постоянна, то в силу монотонности функций затрат очевидно, что АЭ будут выбирать действия с минимальными затратами на соответствующих отрезках. Иначе говоря, условно можно считать, что при фиксированной системе стимулирования множество допустимых действий равно Y = {Y/, Y2, ¦ ¦¦, Ym}, причем, так как ci(0) = 0, то следует положить q0 = 0. Действие, выбираемое i-ым АЭ, определяется парой (Y,q), то есть
имеет место у* (Y,q) = Y^^, где (1) к, = arg max {q^ - Ci(Yk)}, i e I.
k=0,m
69

Обозначим y''(Y,q) = (у* (Y,q), y^(Y,q), .¦., У:(Y,q)). Задача
синтеза оптимальной УНРСС заключается в выборе размерности УНРСС m и векторов q и Y, удовлетворяющих заданным ограничениям, которые максимизировали бы целевую функцию центра:
(2) F{y*(Y,q)) (r) max .
r ^q
Фиксируем некоторый вектор действий у е Л', который мы хотели бы реализовать универсальной нормативной системой стимулирования. Известно, что минимально возможные (среди всех систем стимулирования) затраты на стимулирование по реализации этого вектора соответствуют использованию квазикомпенсаторной системы стимулирования (см. выше и [44]) и равны:
(3) jQKiy*) = XXci (у*).
i=1
Из того, что при использовании УНРСС АЭ выбирают действия только из множества Y, следует, что минимальная размерность системы стимулирования должна быть равна числу попарно различных компонент вектора действий, который требуется реализовать. Следовательно, использование УНРСС размерности, большей, чем n, нецелесообразно. Поэтому ограничимся системами стимулирования, размерность которых в точности равна числу АЭ, то есть положим m = n.
**
Для фиксированного у еЛ' положим Yi=yi , i е I, и обозначим
cij=ci(Yj), i,jeI. Из определения реализуемого действия (1) следует, что для того, чтобы УНРСС реализовывала вектор у еЛ' необходимо и достаточно выполнения следующей системы неравенств:
(4) q, - Cii > qj - Cij, i e I, j = 0, n .
Запишем (4) в виде
(5) qj - q, ? a^, i e I, j = 0, n,
где a^j = C'j - c**. Обозначим суммарные затраты на стимулирование
по реализации действия у УНРСС
* n *
(6) ^унРСССУ*) = X Чг (у ),
i=1
где q(y*) удовлетворяет (4). 70
Задача синтеза оптимальной (минимальной) УНРСС заключается в минимизации (6) при условии (5).
Из того, что q* > с**, i е I, немедленно следует, что ^у е Л' выполнено: ^унрссСу*) > JQKiy*), то есть минимальные затраты на стимулирование по реализации любого вектора действий АЭ при использовании универсальных нормативных систем стимулирования не ниже, чем при использовании квазикомпенсаторных систем стимулирования. Следовательно, для эффективностей стимулирования справедлива следующая достаточно "грубая" оценка: KyНPСС ? Kqk. Потери от использования УНРСС обозначим36Л(УНРСС, QK) = ^унрсс(у*) - JQKiy*) > 0.
Таким образом, исследование УНРСС свелось к необходимости ответа на следующие вопросы - какие векторы действий АЭ могут быть реализованы в этом классе систем стимулирования (иначе говоря, для каких действий система неравенств (5) имеет решение) и в каких случаях УНРСС являются оптимальными во всем классе допустимых систем стимулирования (иначе говоря, при каких условиях Л(УНРСС, QK) = 0).
Введем в рассмотрение n-вершинный граф Goiy*), веса дуг в котором определяются Цаг^Су*)!!. Задача минимизации (6) при условии (5) является задачей о минимальных неотрицательных потенциалах вершин графа Ga , для существования решения которой необходимо и достаточно отсутствия контуров отрицательной длины [5]. Таким образом, справедлива следующая
Лемма 5.1.1. Для того чтобы вектор у е Л' был реализуем в классе УНРСС, необходимо и достаточно, чтобы граф Ga(y*) не имел контуров отрицательной длины.
Рассмотрим следующую задачу о назначении:
n
(7) XCijxij (r) min
г, j=1 {xij}
(8) xij e {0;1}, i, j, e I; X xj = 1, j e I; Xxj = 1, * e I.
i=1 7=1
Лемма 5.1.2. Для того чтобы в решении задачи (7)-(8) выполнялось x** = 1, i е I, X.j = 0, j ^ i, необходимо и достаточно, чтобы граф Go(y*) не имел контуров отрицательной длины.
Доказательство. Пусть (i/, ,2, ¦¦¦, in) - решение задачи (7)-(8), то есть назначение
(9) УГ1 = у*, УГ2 =У:, ¦¦¦, У'п = y: минимизирует (7).
Предположим, что Vj е I ij = j и в графе Goiy ) имеется контур отрицательной длины. Тогда существует такое переназначение (перестановка вершин графа, входящих в этот контур), которое уменьшит суммарные затраты (7), следовательно, исходное назначение не является решением задачи (7)-(8) - противоречие.
Пусть граф Goiy*) не имеет контуров отрицательной длины. Предположим, что решение (i/, i2, ¦¦., in) не является оптимальным решением задачи (7)-(8). Пусть (/1, j2, ¦¦¦, jn) - оптимальное решение. Тогда решение (J/, j2, ¦¦¦, jn) можно получить из решения (i/, ,2, ¦¦¦, in) путем переназначений, которым в графе Gaiy*) соответствуют один или несколько контуров отрицательной длины. Однако, при этом суммарные затраты могут только увеличиться. Таким образом, (i1, i2, ¦¦¦, in) - оптимальное решение. •
Следствием лемм 5.1.1 и 5.1.2 является следующая теорема, характеризующая множество всех действий, реализуемых универсальными нормативными ранговыми системами стимулирования.
Теорема 5.1.1. Для того чтобы вектор у е Л' был реализуем в классе УНРСС, необходимо и достаточно, чтобы он являлся решением задачи о назначении (7)-(8).
Из теории графов известно [5], что в оптимальном решении задачи (5)-(6) минимальна не только сумма потенциалов вершин графа Ga (суммарные затраты на стимулирование), но и минимальны все потенциалы вершин (индивидуальные вознаграждения). То есть решение задачи о назначении (7)-(8) и двойственной к ней задачи (5)-(6) минимизирует не только суммарные выплаты АЭ со
72
стороны центра, но обеспечивает минимальные значения всем индивидуальным вознаграждениям.
Приведенные выше результаты характеризуют множество действий, реализуемых УНРСС. Исследуем теперь эффективность этого класса систем стимулирования.
Имея результат теоремы 5.1.1, мы имеем возможность предложить алгоритм вычисления минимальных потенциалов, и, следовательно, количественно оценить потери в эффективности.
Рассмотрим задачу (7)-(8). Перенумеруем АЭ таким образом, чтобы оптимальным было диагональное назначение Vj е I ij = j (x** = 1). Поставим в соответствие ограничению (7) двойственную переменную uj, j е I, а ограничению (8) - двойственную переменную v*, i е I. Ограничения двойственной к (7)-(8) задачи имеют вид:
(10) Uj - Vi ? aij, i, j, e I.
Заметим, что так как x** = 1, i e I, то u* - v* = a** = 0, а значит u* - v* = q*. Используя этот факт, определим следующий алгоритм:
Шаг 0. UJ = Cjj, j е I.
Шаг 1. vi:= max {uj - a^j}, i e I. j^1
Шаг 2. UJ:= min {v* + a^j}, j e I.
iel
Последовательное повторение шагов 1 и 2 алгоритма конечное число (очевидно, не превышающее n) раз даст оптимальное решение задачи (5)-(6):
(11) q, = u, = Vi, i e I.
Приведенный выше алгоритм позволяет решать задачу поиска минимальных потенциалов графа Ga, удовлетворяющих условию (5), то есть реализующих заданный вектор действий АЭ. С одной стороны доказанный выше критерий реализуемости заданных действий и алгоритм синтеза оптимальной УНРСС применимы в широком классе активных систем, так как при их доказательстве не вводилось практически никаких предположений о свойствах элементов АС. С другой стороны, для ряда более узких классов АС, рассматриваемых ниже, существуют более простые алгоритмы синтеза оптимальных УНРСС.
73
Обозначим
, dc. (у*)
(12) Сг(уг) = i е I.
dyi
и введем следующее предположение:
А.5.4. Существует упорядочение АЭ элементов, такое, что
(13) Vy е Л с1(у) > С2(у) > ¦¦¦ > СП(У).
Фиксируем некоторый вектор у* е Л', удовлетворяющий следующему условию:
(14) у* ? у * ? ¦¦¦ ? у*.
Предположениям А.5.2-А.5.4 удовлетворяют, например, такие распространенные в экономико-математическом моделировании функции затрат АЭ, как: Ciiy*) = к* ciy*), Ciiy*) = к* ciyi/k,) где с( ) - монотонная дифференцируемая функция, а коэффициенты упорядочены: k/ > к2 > ¦¦¦ > kn (частными случаями являются линейные функции затрат, функции затрат типа Кобба-Дугласа и др.).
Лемма 5.1.3. Если выполнены предположения А.5.1, А.5.2 и А.5.4, то в задаче (7)-(8) оптимально диагональное назначение.
Справедливость утверждения леммы следует из того, что любая перестановка диагонального назначения в силу предположения А.4 увеличивает суммарные затраты (отметим, что при этом предположения А3 не требуется).
Таким образом, лемма 5.1.3 дает простое решение задачи о назначении (7)-(8): в случае, когда выполнено предположение А.4. АЭ, имеющим большие удельные затраты, должны назначаться меньшие действия. Необходимые и достаточные условия реализуемости действий УНРСС и лемма 5.1.3 позволяют охарактеризовать множество действий, реализуемых УНРСС в рамках предположения А.4.
Следствие. Если выполнены предположения А.5.1, А.5.2 и А.5.4, то универсальными ранговыми системами стимулирования реализуемы такие и только такие действия, которые удовлетворяют
(14).
В активных системах, удовлетворяющих предположениям А.5.1-А.5.4 (включая А.5.3!), для определения оптимальных потенциалов может быть использована следующая рекуррентная проце-
74
дура, являющаяся частным случаем (соответствующим А.5.3-А.5.4) общего приведенного выше алгоритма:
q/ = C//, q, = Сгг + max {qj - С*/}, i = 2, n .
j<i
Лемма 5.1.4. Если выполнены предположения А.5.1-А.5.4, то
имеет место: V i = 2, n max {qj - сг/} = qi.^/ - cii-/.
j<i
Доказательство. Из предположений А.5.3-А.5.4 следует, что Vy е Л C/(y) > С2(у) > ¦¦¦ > Cn(y). Из (13) следует, что максимум по j<i в выражении для q* достигается при J = i - 1. •
Следствием леммы 5.1.4 является следующее простое выражение для индивидуальных вознаграждений в УНРСС, реализующей вектор у е Л'в активной системе, удовлетворяющей А.5.3-А.5.4:
(15) q, = XX (Cj( у*) - Cj( y:_l)).
J=1
Подставляя (15) в (6), получаем, что потери от использования универсальных нормативных ранговых систем стимулирования (по сравнению с квазикомпенсаторными) равны:
(16) Л(УНРСС, QK) = дунРСС(у*) - JQKiy*) =
= XX {{ X (Cj( у* ) - Cj( У*-!))} - Ci( Уг*_1)}.
i=1 J=1
Совокупность полученных выше результатов сформулируем в виде следующей теоремы.
Теорема 5.1.2. Если выполнены предположения А.5.1 - А.5.4,
то:
а) в классе универсальных нормативных ранговых систем стимулирования реализуемы такие и только такие действия, которые удовлетворяют условию (14);
б) оптимальное решение задачи стимулирования при этом определяется выражением (15);
в) превышение затратами на стимулирование минимально необходимых определяется выражением (16);
г) оптимальная УНРСС является прогрессивной. Утверждение пункта г) теоремы обосновывается следующим
образом: из (15) следует, что qi+/ > Ci+/,i+/ + (q* - Ci+/,i). В силу моно-
75

тонности затрат и (14): ci+/,i+/ - ci+/,i > 0, следовательно V i =1,n-1 qi+/ > q*, то есть система стимулирования также монотонна (прогрессивна).
Отметим, что выше исследовались УНРСС размерности n. Частым случаем УНРСС являются унифицированные системы стимулирования С-типа (УНРСС размерности 1) [55]. Поэтому рассмотрим задачу (первого рода) синтеза унифицированной системы стимулирования, в которой центр назначает общий для всех АЭ план и использует унифицированную систему стимулирования С-типа или QK-типа.
Пусть выполнено предположение А.5.1 и центр должен назначить унифицированную систему стимулирования С-типа с одним "скачком":
(17) a(x, уг) =
, Уг > x , О^ Уг < x'
где С - некоторая неотрицательная величина, x - общий для всех АЭ план.
Введем следующее предположение:
А.5.5. Существует упорядочение АЭ, такое, что
(18) Vy е Л diy) >С2(у) >¦¦¦ >Cn(y).
Отметим, что, если выполнены А.5.1-А.5.4, то, очевидно, выполнено и А.5.5 (см. доказательство леммы 5.1.4). Под совместным выполнением А.5.4. и А.5.5 будем подразумевать, что существует упорядочение элементов, удовлетворяющее одновременно (13) и (18).
Обозначим P(x,С) - множество тех АЭ, у которых затраты в точке x не превышают С, то есть таких элементов, которым выгодно выполнение плана x:
(19) P(x,С) = {* е I | Ci(x) ? С}.
Другими словами, из А.5.5 следует, что P(x,С)={k(x,C),¦¦¦n}• где
(20) k(x,C) = min {i е I | cix) ? C}.
АЭ из множества Q(x,C) = {1, 2, .¦., k(x,C)-1} выполнение плана x при вознаграждении С невыгодно (естественно, V x е Л, V C > 0 P(x,С) п Q(x,C) = 0, P(x,С) и Q(x,C) = I), и они выберут действия, минимизирующие затраты (в рамках А.5.3 - действия, равные нулю). 76

Тогда действия { у* }, реализуемые системой стимулирования (17), удовлетворяют:
(21) Уг (X,С) =
f x, i > k(x, C)
0, i < k(x, C) ¦
Суммарные затраты на стимулирование при использовании центром системы стимулирования (17), в силу (21), равны
(22) J(x,С) = С (N-k(x,C)+1).
Как показано в [18, 36] зависимость у* (x,С) не является непрерывной. Поэтому для каждого x е Л существует конечное число минимальных затрат на стимулирование, при которых изменяется число АЭ, выполняющих план x: {c/(x), c2(x), .¦., c^ix)}. Аналогично, для фиксированного C при непрерывных и строго монотонных
функциях затрат АЭ существует конечное число планов {с* ^(C)},
где "-/" обозначает обратную функцию, при которых изменяется число АЭ, которые их выполняют.
Общий (для случая, соответствующего А.5) алгоритм решения задачи синтеза оптимальной унифицированной системы стимулирования приведен в [18]. Ниже мы сравним минимальные затраты на стимулирование.
Фиксируем произвольный план x е Л. Для того чтобы все АЭ выбрали действия, совпадающие с планом, необходимо, чтобы k(x,C) = 1, то есть C = c/(x). Тогда из (21)-(22) получаем, что минимальные затраты на стимулирование равны (напомним, что индекс "U" соответствует унифицированным системами стимулирования) JUQK(X) = N c/(x). Следовательно, потери в эффективности (по сравнению с системами стимулирования QK-типа) составляют:
(23) D(x) = JUQK(X) - JQK(X) = (N-1) dix) - X Ci(x).
77
i=2

5.2. СОРЕВНОВАТЕЛЬНЫЕ РАНГОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ
В нормативных РСС центр фиксировал процедуру классификации, определяя множества действий или результатов деятельности, при попадании в которые АЭ получал заданное вознаграждение. В отличие от НРСС, в соревновательных ранговых системах стимулирования (СРСС) центр фиксирует процедуру сравнительной оценки деятельности АЭ, задает число классов и число мест в каждом из классов, а также величины поощрений АЭ, попавших в тот или иной класс. Таким образом, в СРСС индивидуальное поощрение АЭ не зависит непосредственно от абсолютной величины выбранного им действия, а определяется тем местом, которое он занял в упорядочении показателей деятельности всех АЭ.
Соревновательные системы стимулирования исследовались как в теории активных систем (см. обзор [34], а также монографии [4, 55]), так и в теории контрактов [59]. Зарубежные исследователи акцентировали внимание в основном на активных системах, функционирующих в условиях внешней интервальной неопределенности и симметричной информированности (см. классификацию в [21, 44]), ограничиваясь в большинстве случаев либо двухэлементными системами [65], либо случаем идентичных АЭ [57, 64]. В работах российских авторов построены оптимальные СРСС для ряда практически важных частных случаев, в том числе - рассматриваемых ниже линейных функциях затрат АЭ и функциях затрат вида С'СУ*) = k* с(уг) [4, 55]. Там же показано, что в случае интервальной неопределенности (незнании центром истинных значений параметров {k*}) СРСС могут быть более эффективны, чем систе-
n
мы стимулирования следующего вида: ai(y) = у* /X У/ . Сравни-
7=1
тельная эффективность СРСС и других систем стимулирования практически не исследовалась.
Следует отметить, что теоретико-игровой анализ СРСС (или соревновательных механизмов стимулирования, как их иногда называют [15]), гораздо более сложен и трудоемок, нежели, чем "обычных" или нормативных систем стимулирования. Основная
78
сложность заключается в том, что при использовании СРСС у АЭ не существует равновесных по Нэшу стратегий, следовательно, возникает необходимость введения гипотез о поведении элементов [47] и искусственного построения множества решений игры.
Как отмечалось выше, в настоящей работе нас в основном интересует сравнительная эффективность тех или иных систем стимулирования в многоэлементных активных системах. Поэтому, не вдаваясь в подробности теоретико-игрового анализа, оценим эффективность соревновательных РСС в сравнении с "абсолютно оптимальными" квазикомпенсаторными системами стимулирования.
Предположим, что в активной системе, состоящей из n АЭ, выполнены предположения А.5.1-А.5.3 и А.5.5, а центр использует следующую систему стимулирования: действия, выбранные АЭ, упорядочиваются в порядке возрастания, после чего каждый из АЭ получает вознаграждение q*, соответствующее его номеру i в упорядочении действий.
Пусть выполнены предположения А.5.1-А.5.3 и А.5.4. Понятно, что первый АЭ (имеющий максимальные затраты при любом допустимом действии) будет всегда выбирать нулевое действие, поэтому положим вознаграждение q1 за первое место в упорядочении действий равным нулю: q1 = 0.
Будем рассматривать серию моделей АС, последовательно усложняя их. При этом каждая последующая модель будет включать предыдущую в качестве частного случая.
Начнем с рассмотрения активной системы, в которой АЭ имеют линейные функции затрат [4, 55]: С.СУ*) = k* у*, k* > 0, причем:
(1) k/ >k2 >¦¦¦ >kn.
Линейные функции затрат при условии (1) удовлетворяют предположениям А.5.2-А.5.5. Предположим, что упорядочение действий, выбираемых АЭ, совпадает с упорядочением значений их функций затрат:
(2) уо = 0 ?y: ?y: ? ¦¦¦ ?y:.
Отметим, что упорядочение (2) совпадает с оптимальным назначением АЭ в соответствующей задаче о назначении (см. формальные результаты выше в разделе 5.1).
79
Рассматривая последовательно АЭ в порядке возрастания их номеров, из условия того, что предыдущий АЭ может угрожать последующему АЭ увеличением действия и занятием более высокого места до тех пор, пока его полезность неотрицательна, получаем, что при заданной соревновательной системе стимулирования {q*} действия, выбираемые АЭ, определяются следующим образом:
Ч/ - Ч,-1
Ч< Ч< X-^ 1 7 1 I
(3) Уо = 0, у* = X J, 7 , i = 2,n . j=2 kj-1
В другую сторону, если задан вектор у е Л', то из условия " угроз" получаем, что вознаграждения должны удовлетворять:
(4) q/ = 0, q, = qг-/ + kг-/(у* -у*-!) = X kj-/ (у, -), i = 2,n .
J=2
Выражение (4) для индивидуальных вознаграждений можно
записать следующим образом: q* = X (kJ-/ - k) у*, + ki-/ у*. Из
J = 2
(3)-(4) следует, что рассматриваемая соревновательная система стимулирования является прогрессивной, то есть вознаграждение АЭ возрастает с ростом занимаемого места. При этом превышение суммарными затратами на стимулирование минимально необходимых равно:
(5) Л(СРСС, QK) = X { X kj! (у* - у*-!) - kiy*} > 0.
г=2 /=2
Условия (3)-(4) по своему построению обеспечивают невыгодность для каждого АЭ выбора действия с номером, превышающим его номер в упорядочении затрат. Однако условие реализуемости некоторого действия подразумевает, что выбор этого действия выгоден АЭ по сравнению с выбором любого другого допустимого действия. Невыгодность выбора элементом действий, номер которых строго меньше его номера в упорядочении затрат, обосновывается в доказательстве следующей леммы.
Лемма 5.2.1. Соревновательная система стимулирования (4) реализует вектор действий (2).
Доказательство. Фиксируем произвольное i е I. Предположим, i-му АЭ выгодно занять l-ое место, то есть, что существует дейст-
80
вие yi* < у*, такое, что имеет место: fi( у* ) >fi( у* ). Тогда
l * * * i * * * (6) X kj-/ (у* - у*-1) - ki у* > X kj-/ (у* - у*-1) - ki у*.
J=2 J=2
Преобразовывая (6) и пользуясь упорядочением коэффициентов функций затрат АЭ, получаем у* > у* - противоречие. •
Следствием доказательства результата леммы 5.2.1 является утверждение о том, что в классе соревновательных систем стимулирования реализуемы такие и только такие вектора действий, компоненты которых удовлетворяют упорядочению (2).
Сравним эффективности соревновательных и нормативных ранговых систем стимулирования. Из предшествующего анализа свойств УНРСС получаем, что вектор действий у е Л' реализуем
следующей УНРСС {˜(у*)}: ˜ (у*) = X k, (у* - у"J-i). Следо-
'J J- J=2
вательно:
л _ л ж-\ ч" ч"
(7) V i = 1,n qiiy*) - ˜г (у ) = X (kj! - kj) (у: - у:-l) > 0.
J = 2
Сравнивая (5) и (7), получаем, что
(8) Vy*e Л' ^СРСС(У*) - ^УНРСС(У') = XX (kj! - k) (У* -У.^-i) > 0.
г=1 /=2
Из (8) следует, что минимальные суммарные затраты на стимулирование по реализации произвольного вектора действий выше при использовании соревновательных ранговых систем стимулирования (по сравнению с универсальными нормативными). Следовательно, СРСС менее эффективны, чем УНРСС. Потери в эффективности могут быть количественно оценены из выражений (4), (7) и (8).
Усложним модель, предположив, что функции затрат АЭ имеют вид: С.СУ,) = k* ciy*), где коэффициенты k* удовлетворяют (1). Относительно функции с( ) предположим, что она непрерывна, монотонно возрастает и с(0) = 0 (при этом выполнены предположения А.5.2-А.5.5). Отметим, что при ciy*) = у* получаем рассмотренный выше частный случай линейных функций затрат АЭ.
81

Предположим, что действия АЭ, реализуемые СРСС, удовлетворяют (2). По аналогии с тем, как это делалось для линейных затрат, принимая соглашение, что, если верхний индекс суммирования меньше нижнего, то вся сумма равна нулю, получаем (ср. с (3) и (4)):
(9) уО = 0, Уг* = с-^{ }, * = l-n ,
J=2
kj-1
i
(10) q/ = 0, q, = X kj! (c( y*) - c( y*-!)), i = 2,n .
J=2
Имея выражения (9) и (10), можно решать задачи синтеза СРСС, удовлетворяющих тем или иным свойствам. Например, в [55] решалась задача синтеза СРСС, удовлетворяющей ограниче-
нию фонда заработной платы R: X q* ?R.
i =1
Из (9)-(10) видно, что рассматриваемая соревновательная система стимулирования является прогрессивной. Результат леммы, характеризующей множество действий, реализуемых СРСС, также остается в силе (доказательство проводится аналогичным образом, изменяются лишь используемые при оценках неравенств преобразования).
Превышение суммарными затратами на стимулирование минимально необходимых равно:
(12) Л(СРСС, QK) = X { X (kj-/ - kj) с( у*) } > 0.
г=2 /=2
Как и ранее, сравним эффективности соревновательных и нормативных ранговых систем стимулирования. Из предшествующего анализа свойств УНРСС получаем, что вектор действий у* е Л'реализуем следующей УНРСС {q*}:
˜г (у*) = X kj (с( у* ) - с( у*-!)).
J=2
Тогда имеет место следующее соотношение между индивидуальными вознаграждениями:
82

V i = 1,n q,(y*) - ˜г (у*) = X (kj1 - k) (с( у: ) - с( у:-l)) > 0,
J=2
следовательно, справедливо следующее соотношение между минимальными затратами на стимулирование: (13) Vy*e Л' Jcpcciy*) - JyHPcciy*) =
= XX (kj-/ - kj) (с( у*) - с( y:-l))> 0.
i=1 J=2
И соотношения (13) следует, что для рассматриваемой модели также имеет место (8), то есть минимальные суммарные затраты на стимулирование по реализации произвольного вектора действий по-прежнему выше при использовании соревновательных ранговых систем стимулирования (по сравнению с универсальными нормативными). Следовательно, и в случае С.СУ,) = k* с(уг) СРСС менее эффективны, чем УНРСС.
Усложним рассматриваемую модель. Предположим, что АЭ имеют произвольные функции затрат, удовлетворяющие А.5.3- А.5.4.
Теорема 5.2.1. Если выполнены предположения А.5.3-А.5.4, то необходимым и достаточным условием реализуемости вектора действий АЭ у* е Л в классе СРСС является выполнение (2), причем данный вектор реализуем следующей системой стимулирования:
(14) qi(y') = X {Cj-/( у* ) - Cj-/( у*-1)}, i = ^,n .
J = 2
Доказательство теоремы 5.2.1 проведем по аналогии с доказательствами для частных случаев выше. Последовательно рассматривая АЭ (начиная с первого в упорядочении затрат по убыванию), получаем, что (14) в силу лемм 5.1.1 - 5.1.4 обеспечивает невыгодность угроз со стороны любого АЭ элементам с большим номером. Проверим выполнение "обычных" условий реализуемости.
Фиксируем произвольный номер i е I и предположим, что i-му
АЭ выгодно занять l-ое место, то есть, что существует действие yi < у* , такое, что имеет место:/*( у* ) > /*( у* ). Тогда
83
l
(15) X {Cj-/(у*) - C/ziу*-!)} - Ci(у*) >
J=2
i
> X {cj-/( у* ) - Cj-/( У:-1)} - ci( Уг*).
j=2
Преобразовывая (15) к виду:
X {Cj-/( у* ) - C/zi у :-l )} < Ci( Уг* ) - Сг( у* )
J=l +1
и пользуясь упорядочением и свойствами функций затрат АЭ, отражаемыми предположениями А.5.3-А.5.4, приходим к противоречию. •
Гораздо более важную методологическую роль, чем ее доказательство, играют содержательные интерпретации утверждения теоремы 5.2.1. Из лемм 5.1.1-5.1.4 и 5.2.1 следует, что унифицированными РСС реализуемы только такие действия, которые являются решением соответствующей задачи о назначении, кроме того, в рамках предположений А.5.2-А.5.4 оптимально диагональное назначение. Следовательно, условие (2) является необходимым условием реализуемости.
Для того чтобы доказать, что СРСС (14) реализует вектор действий (2) необходимо и достаточно показать, что выполнены два условия. Первое условие - условие реализуемости "обычной" системой стимулирование, то есть условие того, что каждому АЭ невыгодно изменять свою стратегию при фиксированной обстановке игры (условия равновесия Нэша). Второе условие характерно для соревновательных систем стимулирования, так как для них условий "обычной" реализуемости недостаточно - следует проверить условия "угроз" (см. выше).
Утверждение "некоторый АЭ не может быть спокоен до тех пор, пока другой АЭ может угрожать ему изменением своей стратегии", выражающее условие "угроз", отражает, фактически, предположения АЭ о поведении других АЭ. Следовательно, при использовании СРСС необходимо, но недостаточно накладывать условия реализуемости (в смысле Нэша), а следует использовать доопределение равновесия (в данном случае - аналог равновесия
84
Штакельберга) [47, 57, 66].
Используя (14), легко получить оценки сравнительной эффективности СРСС и УНРСС, а также СРСС и компенсаторных систем стимулирования (неравенства выполнены в силу предположений А.3. и А.4):
(16) V у е Л' Jcpcciy*) - JvHPcciy*) =
= XX X [Cj-/( у* ) - с/( у* ) + С/( у :-l ) - Cj-/( у :-l )] > 0.
г=1 7=2
(17) Л(СРСС, QK) = X { X {Cj-/( у*) - Cj1( у**-!)} - Сг( Уг*)} > 0.
г=2 7=2
Рассмотренные выше линейные и другие функции затрат удовлетворяют предположениям А.5.3-А.5.4 - легко видеть, что, соответственно, выражение (14) включает выражения (4) и (10) и т.д. как частные случаи. Разность (16) может также интерпретироваться как доплата за условие "угроз" по сравнению с равновесием Нэша.
В заключение настоящего раздела отметим, что выше было получено общее решение задачи синтеза оптимальной унифицированной нормативной ранговой системы стимулирования (см. леммы раздела 5.1 и соответствующий алгоритм). Для соревновательных систем стимулирования решение и оценки сравнительной эффективности получены лишь в рамках дополнительных предположений А.5.3-А.5.4 о свойствах функций затрат АЭ. Поэтому перспективным направлением дальнейших исследований является получение решения задачи синтеза оптимальной соревновательной системы стимулирования в общем случае. Для последнего можно утверждать, что необходимые условия реализуемости, приведенные выше (см. теорему 5.2.1) останутся в силе, изменятся лишь достаточные условия, обеспечивающие невыгодность "угроз".
85
6. УНИФИЦИРОВАННЫЕ ПРОПОРЦИОНАЛЬНЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ
Как было показано выше и в [18,36,42], в некоторых АЭ использование унифицированных систем стимулирования может приводить к снижению эффективности управления. В то же время, в некоторых АЭ, в том числе - в рассматриваемых ниже, оптимальными являются именно унифицированные системы стимулирования.
Введем следующее предположение относительно функций затрат АЭ (ниже это предположение будет ослаблено):
(1) Сг(уг,Гг) = Г, j (у, /г,), * е I,
где j( ) - гладкая монотонно возрастающая выпуклая функция, j(0)=0, (например, для функций типа Кобба-Дугласа j(t) = 1/a ta, a>1), г* > 0 - некоторый параметр.
Если центр использует пропорциональные (L-типа) индивидуальные системы стимулирования: Oiiy*) = g* У*, то целевая функция АЭ имеет вид: fiiy,) = g* у* - Ciiy*). Вычислим действие, выбираемое АЭ при использовании центром некоторой фиксированной системы стимулирования:
(2) Уг*(^) = Гг j ' -/(gд•
где j ' -/(•) - функция, обратная производной функции j( ). Минимальные суммарные затраты на стимулирование равны:
(3) Jlig) = X gi Гг j ' -/(gд•
i=1
где g = (g/, g2, ..., gn). Суммарные затраты элементов равны: n
(4) C(g) = X Гг j(j ' -/(Y)).
i=1
В рамках приведенной выше общей формулировки модели пропорционального стимулирования возможны различные постановки частных задач. Рассмотрим некоторые из них.
Задача 1. Пусть центр заинтересован в выполнении элементами плана R по суммарному выпуску с минимальными суммарными затратами АЭ (еще раз подчеркнем необходимость различения
86

суммарных затрат элементов и суммарных затрат (центра) на стимулирование). Тогда его цель заключается в выборе ставок оплаты {gi} в результате решения следующей задачи:
cig) (r) min
(5)
g
n
X УгСГг ) = R i=1
решение которой имеет вид:
(6) g* = j (R/W); y* = Гг (R/W); iel, c* = Wj(R/W); JL = R j'(R/W).
n
где W = X Г* . Так как оптимальные ставки оплаты одинаковы для
i=1
всех АЭ, то оптимальна именно унифицированная (!) система стимулирования.
Задача 2. Содержательно двойственной к задаче 1 является задача максимизации суммарного выпуска при ограничении на суммарные затраты АЭ: n*
(7)
X Уг (gi) (r) max i=1 g . c(g) ? R
Решение задачи 2 имеет вид:
**
(8) g* = j (j -/(R/W)); y* = Гг j -/(R/W); i e I,
c* = R; JL = j-/(R/W)Wj'(j -/(R/W))• то есть в двойственной задаче (естественно) оптимальным решением также является использование унифицированных пропорциональных систем стимулирования.
Замена в задачах 1 и 2 суммарных затрат элементов на суммарные затраты на стимулирование порождает еще одну пару двойственных задач.
87
Задача 3. Если центр заинтересован в выполнении АЭ плана R по суммарному выпуску с минимальными суммарными затратами на стимулирование, то ставки оплаты определяются в результате решения следующей задачи:

JL (g) (r) min
g
N * ,
X y.ig: ) = R i =1
решение которой совпадает с (6)!
Задача 4 заключается в максимизации суммарного выпуска при ограничении на суммарные затраты на стимулирование:
' N *
(10)
X yi*(gi) (r) max i=1 g . JL(g)? R
Из метода множителей Лагранжа получаем условие оптимальности (1 - множитель Лагранжа): 1 j' -/(gi) j"(gi) + = 1, i e I, из которого следует, что все ставки оплаты должны быть одинаковы и удовлетворять уравнению g j' ˜/(g) = R/W.
Следует подчеркнуть, что во всех четырех задачах оптимальными оказались именно унифицированные системы стимулирования, причем решения задач 1 и 2 совпали, что представляется достаточно уникальным фактом, так как суммарные затраты АЭ отражают интересы управляемых субъектов, а суммарные затраты на стимулирование - интересы управляющего органа. Кроме того, возможность использования общих для всех АЭ управляющих параметров оказывается важной в механизмах планирования (см. [10, 15, 21]). Таким образом, мы доказали следующий результат.
Теорема 6.1. В организационных системах со слабо связанными АЭ, функции затрат которых имеют вид (1), унифицированные системы стимулирования оптимальны на множестве пропорциональных систем стимулирования.
Возникает закономерный вопрос - насколько жесткими являются требования к функциям затрат АЭ. Оказывается, эти требования можно ослабить - в задачах типа задачи 1 и задачи 2 оптимальность унифицированных систем стимулирования является следствием свойств задач условной оптимизации и практически не зависит от конкретного вида функций затрат.
Рассмотрим организационную систему со слабо связанными элементами, в которой функции затрат АЭ С.СУ)) - гладкие, возрастающие и выпуклые (содержательно, выпуклость "нужна" для
88

единственности точки максимума разности между линейным стимулированием и затратами). Вектор действий, реализуемый пропорциональной системой стимулирования со ставками {gg}, суммарные затраты АЭ и суммарные затраты на стимулирование определяются, соответственно:
(11) Уг* (^)=Сг' -/(gд, iel; c(g) = X Ci(Ci ' -/(g)); Jl(^= X ^ c, ' -/(g).
i =1 i =1 Для задач типа 1 и 2, применяя метод множителей Лагранжа, получаем, что при ослаблении требований к функциям затрат оптимальными остаются унифицированные системы стимулирования (например, в задаче 1 оптимальное значение g удовлетворяет
n
уравнению: X с* ' ˜/(g) = R). Для задач типа 3 и 4, к сожалению, в
i=1
общем случае унифицированные системы стимулирования не оптимальны. Применяя к ним, опять же, метод множителей Ла- гранжа, легко показать, что достаточным условием для оптимальности систем стимулирования UL-типа является существование функции ^i ), такой, что V i е I с, '-/(gl) Ci"(Yi) = Xigi).
Отметим, что в приведенной выше теореме утверждается, что системы стимулирования UL-типа оптимальны на множестве пропорциональных систем стимулирования в АЭ со слабо связанными АЭ, имеющими функции затрат вида (1). Поэтому в заключение настоящего раздела исследуем их сравнительную эффективность на множестве всевозможных (не только пропорциональных) систем стимулирования. Как было показано выше для этого достаточно сравнить минимальные затраты на стимулирование, например, в задаче 2, с затратами на стимулирование в случае использования центром оптимальных квазикомпенсаторных систем
n
стимулирования (которые равны JQK(y*) = X Г* j (yi/гi)).
i=1
Решая задачу выбора вектора у е Л', минимизирующего
n * *
JQK(.y*) при условии X у* = R, получаем, что JqK = W j(R/W).
i=1
Подставляя из выражения (6) ТЗ-щ = R j'(R/W), вычислим отноше-
89
ние минимальных затрат на стимулирование: (12) JUL/J-Qk = R/W j'(R/W)/j(R/W).
Из выпуклости функции j( ) следует, что JuL/J:K > 1. Так
как суммарные затраты на стимулирование при использовании систем стимулирования UL-типа выше, чем при использовании "абсолютно оптимальных" систем стимулирования QK-типа, следовательно, первые не оптимальны в классе всевозможных систем стимулирования. Более того, можно показать, что при R/W > 0 и строго выпуклых функциях затрат отношение (12) строго больше единицы. Полученный для многоэлементных организационных систем результат вполне согласован с выводом [36, 42] о том, что в одноэлементных системах эффективность пропорционального стимулирования не выше, чем квазикомпенсаторного.
7. СТИМУЛИРОВАНИЕ В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ С НЕОПРЕДЕЛЕННОСТЬЮ
В предыдущих разделах настоящей работы построены оптимальные системы стимулирования в детерминированных многоэлементных АС, то есть в АС, в которых центр и активные элементы обладают полной (и, следовательно, симметричной) информацией обо всех существенных внешних и внутренних параметрах. Напомним, что при этом оптимальна та или иная модификация компенсаторной системы стимулирования, причем ключевыми (на этапе согласования) являются две идеи: идея декомпозиции игры активных элементов (специфичная для многоэлементных АС) и идея компенсации затрат (которая оказалась эффективной как в одноэлементных, так и в многоэлементных АС). Имея результаты исследования задач стимулирования в детерминированных многоэлементных АС, можно переходить к исследованию этих задач в АС с неопределенностью.
90
Задачи стимулирования в одноэлементных АС с неопределенностью подробно описаны в монографии [44]. Перечислим кратко основные используемые в упомянутой работе подходы и полученные результаты.
Одним из оснований классификации АС с неопределенностью является информированность участников. Можно выделить АС с симметричной (одинаковой) и асимметричной информированностью участников (в первую очередь важно определить различия в информированностях АЭ и центра), а также на детерминированные АС и АС с неопределенностью. В свою очередь АС с неопределенностью могут классифицироваться по следующим основаниям.
1. Тип неопределенности: внутренняя неопределенность (относительно параметров самой АС), для внутренней неопределенности - относительно целевых функций, допустимых множеств или и того и другого; внешняя неопределенность (относительно параметров окружающей среды, то есть внешних по отношению к АС) и смешанная неопределенность (для части участников АС - внутренняя, для других - внешняя; или обоих типов);
2. Вид неопределенности: интервальная (когда участнику АС известно множество возможных значений неопределенного параметра), вероятностная (известно вероятностное распределение - вероятностные АС) и нечеткая (известна функция принадлежности - нечеткие АС) неопределенность, а также смешанная неопределенность (все возможные комбинации перечисленных видов неопределенности для различных участников).
Таким образом, АС, функционирующие в условиях неопределенности, могут быть классифицированы по: информированности участников (симметричная - С, асимметричная - А), типу неопределенности (внутренняя и внешняя) и виду неопределенности (интервальная, вероятностная и нечеткая). Перечисляя все возможные комбинации значений признаков классификации по этим основаниям, получаем двенадцать37 базовых моделей АС с неопре- деленностью, которые, совместно с базовой детерминированной моделью в [44] условно обозначены М1 - М13.
Приведенные в [44] результаты систематического исследования базовых задач стимулирования в одноэлементных АС с неопределенностью свидетельствуют, что в рамках базовых моделей (одноэлементных, статических) стимулирования возможен единый методологический подход к решению задач анализа и синтеза систем стимулирования. Несмотря на многообразие изучаемых моделей, используемый подход заключается в единообразии их описания, общности технологии и техники исследования, причем последняя основывается, как и детерминированная теория активных систем, на изучении множеств реализуемых действий и минимальных затрат на стимулирование. Поясним последнее утверждение, приведя описание, технологию и технику построения и исследования моделей механизмов стимулирования как в детерминированных одноэлементных и многоэлементных активных системах, так и в одноэлементных АС с различными типами и видами неопределенности.
После описания модели, то есть задания в соответствии с введенными параметрами модели и системой классификаций задач управления в АС [42, 44] класса исследуемых активных систем, определяется рациональное поведение АЭ: на основании известных предпочтений АЭ на множестве результатов деятельности и/или действий (эти предпочтения зависят от используемого центром механизма управления) и имеющейся информации о неопределенных факторах (взаимосвязи между действиями АЭ и результатами его деятельности) определяются предпочтения АЭ на множестве его стратегий (действий и/или сообщаемых оценок).
В случае интервальной неопределенности этот переход осуществляется с использованием принципа максимального гарантированного результата (МГР), в случае вероятностной (нечеткой) неопределенности целевая функция АЭ на множестве результатов его деятельности совместно с распределением вероятностей (нечеткой информационной функцией) индуцирует на множестве допустимых стратегий целевую функцию - ожидаемую полезность
имеет место смешанная неопределенность. 92
(индуцированное нечеткое отношение предпочтения (НОП) и т.д.). Множество выбора (решений игры) при заданном множестве стратегий и предпочтениях АЭ, выражаемых, например, его целевой функцией, НОП и т.д., определяется следующим стандартным образом.
В одноэлементных АС считается, что АЭ выбирает одно из действий, максимизирующих его целевую функцию (ожидаемую полезность), или максимально недоминируемое по индуцированному нечеткому отношению предпочтения допустимое действие. В многоэлементных АС считается, что вектор стратегий, выбираемых АЭ, принадлежит множеству равновесий (равновесий Нэша, равновесий в доминантных, гарантирующих или других стратегиях - в зависимости от используемых гипотез и принятой в рассматриваемой модели концепции равновесия).
В случае если множество выбора состоит более чем из одного элемента, необходимо доопределить однозначно (используя гипотезу благожелательности (ГБ) или МГР) выбор АЭ. Этот выбор будет зависеть от механизма управления, эффективность которого задается значением целевой функции центра на множестве выбора АЭ (если предпочтения центра зависят от неопределенных параметров, то необходимо найти его детерминированную систему предпочтений).
Имея критерий сравнения эффективностей различных систем стимулирования на их допустимом множестве, задача синтеза в АС с неопределенностью (и в детерминированных АС - см. выше) формулируется следующим образом: найти допустимую систему стимулирования, имеющую максимальную эффективность.
Техника доказательства большинства формальных результатов использует анализ множества реализуемых действий - тех действий АЭ, которые он выбирает (гарантированно или по ГБ) при заданной функции стимулирования. Критерий сравнения различных систем стимулирования по эффективности может быть сформулирован в терминах множеств реализуемых действий: чем "шире" множество действий, реализуемых системой стимулирования, тем в рамках ГБ выше ее эффективность (двойственным подходом является сравнение минимальных затрат на стимулирование по реализации фиксированного действия) [44]. Поэтому оптимальная
93
система стимулирования (точнее - их класс) имеет максимальное множество реализуемых действий. Следовательно, для того, чтобы доказать оптимальность некоторого класса систем стимулирования достаточно показать, что не существует другой допустимой системы стимулирования, имеющей большее множество реализуемых действий. Этот подход оказывается плодотворным не только при доказательстве оптимальности тех или иных систем стимулирования, но и при исследовании свойств решения, влияния неопределенности и т.д.
Помимо метода анализа множеств реализуемых действий существует альтернативный подход - метод анализа минимальных затрат центра на стимулирование [42, 44], заключающийся в определении для каждого допустимого вектора действий АЭ системы стимулирования, реализующей этот вектор как решение (желательно, единственное!) игры АЭ и требующей от центра минимальных затрат по вознаграждению АЭ. Оптимальной при этом является класс систем стимулирования, реализующих любой вектор действий с минимальными затратами центра. Метод анализа минимальных затрат на стимулирование "проще" метода анализа множеств реализуемых действий в том смысле, что при его использовании на втором этапе решения задачи стимулирования центр определяет оптимальное с его точки зрения реализуемое действие, то есть производит выбор элемента множества Л', на котором достигается максимум его скалярной функции (разности между функцией дохода и суммарными затратами на стимулирование), а не выбирает из множества M (являющегося подмножеством пространства кусочно-непрерывных функций) функцию, доставляющую максимум критерию эффективности стимулирования.
В многоэлементных АС для "сведения" задачи стимулирования к набору хорошо известных одноэлементных задач используется описанная в четвертом разделе настоящей работы идея декомпозиции игры активных элементов.
В качестве иллюстрации использования единства предложенного подхода сформулируем, следуя идеологии, развиваемой в [44], общую для всех моделей АС с неопределенностью (одноэлементных и многоэлементных) последовательность их исследования, включающую следующие этапы:
94
1. Описание модели: определение целевых функций и допустимых множеств, их свойств, а также порядка функционирования и информированности участников АС;
2. Определение рационального поведения АЭ в рамках рассматриваемой модели: задание процедуры (метода) устранения неопределенности и рационального выбора АЭ (определение множества решений игры - множества реализуемых действий);
3. Определение эффективности механизма стимулирования и формулировка, собственно, задачи синтеза оптимального механизма стимулирования;
4. Решение задачи синтеза: поиск аналитического решения и/или разработка алгоритмов численного решения задачи и исследование их свойств: сходимости, сложности и т.д.;
5. Нахождение необходимых и достаточных условий оптимальности;
6. Анализ оптимального решения:
а) свойства оптимального решения, множеств реализуемых действий и минимальных затрат на стимулирование, содержательные интерпретации;
б) влияние неопределенности на эффективность и свойства оптимального механизма стимулирования;
в) влияние параметров модели и определения рационального поведения на эффективность и свойства оптимального механизма стимулирования, в том числе - анализ устойчивости оптимального решения;
7. Исследование частных случаев (при усилении предположений и допущений о параметрах и свойствах модели АС) и возможностей обобщения (соответственно, при ослаблении);
8. Исследование устойчивости решений и адекватности модели моделируемой системе.
9. Внедрение результатов моделирования: идентификация АС, корректировка модели, разработка рекомендаций по практическому использованию, создание вычислительных средств, автоматизированных систем поддержки принятия решений и имитационных моделей.
95
Сводка результатов теоретического исследования задач стимулирования в одноэлементных АС с неопределенностью, а также конкретные вводимые при этом предположения приведены в [44].
Отдельного обсуждения заслуживает влияние неопределенности на эффективность управления АС, так как возможность использования единого подхода к анализу базовых моделей механизмов управления (стимулирования) в АС с различными типами и видами неопределенности позволяет сделать ряд общих выводов о роли неопределенности в управлении АС. Все задачи стимулирования в одноэлементных АС с неопределенностью, рассматриваемые в ТАС, удовлетворяют принципу соответствия38 ^ при предельном переходе ("стремлении" неопределенности к "нулю") они переходят в детерминированные АС, а их оптимальные решения - в оптимальные решения соответствующих детерминированных задач стимулирования.
Принципу соответствия удовлетворяют также большинство выводов о влиянии неопределенности на эффективность стимулирования в одноэлементных АС, причем, что представляется крайне важным, опять же, общей является следующая технология анализа роли неопределенности в АС с неопределенностью. Для двух АС, отличающихся либо множеством значений неопределенного фактора, либо той информацией, которую имеют о нем участники АС, вводится критерий сравнения "величин" неопределенности, с одной стороны учитывающий специфику задачи, а с другой - согласованный с известными мерами неопределенности (например - энтропией и т.д.) [44]. Далее показывается, что в АС с большей неопределенностью множество действий АЭ, реализуемых любой допустимой системой стимулирования, не шире (шире), чем в АС с меньшей неопределенностью, что позволяет сделать вывод о сравнительной эффективности оптимальных систем стимулирования в этих АС. Альтернативный способ - сравнение минимальных затрат центра на стимулирование: если для любого вектора действий АЭ в АС с большей неопределенностью затраты центра по его реализации выше, чем в АС с меньшей неопределенностью то эффективность стимулирования в первом случае не ниже, чем во втором.
Для всех одноэлементных моделей, независимо от типа и вида неопределенности, справедливы следующие выводы: гарантированная эффективность стимулирования в АС с неопределенностью не выше, чем в детерминированной АС, причем с ростом неопределенности эффективность стимулирования уменьшается, а с уменьшением неопределенности - возрастает и стремится к аналогичному показателю для соответствующей детерминированной активной системы.
В одноэлементных моделях величина неопределенности связана с информированностью участников: чем большей информацией обладает центр и/или АЭ, тем меньше неопределенность. В большинстве известных моделей считается, что участники АС, обладая на момент принятия решения некоторой информацией, могут использовать эту информацию и только ее. Возможность получения дополнительной информации отсутствует (использование механизмов с сообщением информации от АЭ центру не является исключением: несмотря на то, что центр получает новую информацию, он получает ее после выбора процедуры планирования, причем сам факт обмена информацией изначально заложен в механизме функционирования). Такой порядок функционирования достаточно распространен на практике. Однако встречаются ситуации, в которых участники АС имеют возможность до принятия решения целенаправленно получать информацию от "окружающей среды" или от других участников системы, причем, в большинстве случаев, для получения этой информации необходимы некоторые финансовые или какие-либо другие затраты.
Механизмы управления, в которых участники АС имеют возможность за плату приобрести информацию, получили название механизмов с платой за информацию [44]. При использовании механизмов с платой за информацию имеют место две противопо-
97
ложные тенденции. С одной стороны, получение дополнительной информации может повысить эффективность управления. С другой стороны, часть средств, потраченная на приобретение информации, уменьшает доход участника АС или его возможности по управлению, что может привести к снижению эффективности управления. Если точность и количество поступающей информации монотонно связаны с затратами по ее получению, то, очевидно, существует некоторый оптимум - компромисс между снижением эффективности, вызванным уменьшением управляющих возможностей, и ее ростом, обусловленным большей информированностью. При этом не исключается, что возможны ситуации, в которых приобретать дополнительную информацию вообще не имеет смысла (плата слишком высока), или наоборот, оказывается целесообразным полное устранение неопределенности.
Существенной чертой механизмов с платой за информацию является добровольность ее приобретения: каждый из участников АС вправе самостоятельно решать приобретать ли ему дополнительную информацию и в каком объеме. Понятно, что, в принципе, приобретать информацию могут как центр, так и активные элементы. Важно также различать, у кого приобретается информация - у третьих лиц, не входящих в состав АС, или у участников самой активной системы. Так, например, возможны механизмы с сообщением информации в АС, в которых центр может, заплатив АЭ определенную сумму, например, уменьшить диапазон возможных (неизвестных для него) значений неопределенного параметра, а затем использовать механизм планирования уже в условиях меньшей неопределенности. Задача манипулирования [42] при этом все равно возникает, однако, следует учитывать, что плата за информацию может изменить значение целевой функции АЭ.
Для получения ответа на вопрос целесообразно ли использование механизмов с платой за информацию и определения оптимальной величины этой платы, необходимо в каждом конкретном случае: определить зависимость информированности участников АС от величины платы за информацию; найти соотношение между эффективностью управления и информированностью участников (величина платы за информацию выступает при этом как пара-
98
метр); вычислить величину платы за информацию, максимизирующую эффективность управления.
Аналогичные рассуждения справедливы, видимо, и для многоэлементных АС с неопределенностью и могут рассматриваться как "программа" их исследования. Ниже описывается ряд моделей многоэлементных АС с неопределенностью, которые исследуются в соответствии с приведенной выше методикой.
Таким образом, на сегодняшний день имеются единые методологические подходы (и полученные в рамках этих подходов конструктивные результаты) к исследованию как многоэлементных детерминированных АС, так и одноэлементных АС с неопределенностью. Полное и систематическое исследование всех моделей многоэлементных АС с неопределенностью представляется задачей, не актуальной на сегодняшний день по следующим причинам. Во-первых, многообразие этих моделей слишком велико (см. сноску выше). Во-вторых, отличаются эти модели не столь сильно: из предшествующего изложения материала настоящей работы видно, что все восемь базовых моделей многоэлементных детерминированных АС имеют много общего, если не в описании, то в методах их исследования; кроме того сформулирован единый подход к анализу задач стимулирования в условиях неопределенности. Следовательно, можно предположить, что в первом приближении при исследовании той или иной конкретной модели многоэлементной АС с неопределенностью можно ограничиться адаптированным применением упомянутых подходов (некоторые примеры приведены ниже). Поэтому в настоящей главе основной акцент делается на выявление специфики многоэлементных АС с неопределенностью как по сравнению с детерминированными многоэлементными АС, так и по сравнению с одноэлементными АС с неопределенностью. Кроме того, как следует из материала предыдущих шести разделов, одни базовые модели стимулирования в многоэлементных АС являются частными случаями других, поэтому ниже мы ограничимся изучением факторов неопределенности в двух наиболее сложных моделях с несепарабельными затратами: S4 (стимулирование каждого АЭ зависит от действий всех АЭ) и S6 (стимулирование каждого АЭ зависит от результата деятельности АС в целом).
99
7.1. ВНУТРЕННЯЯ НЕОПРЕДЕЛЕННОСТЬ
Под внутренней неопределенностью понимают неполную информированность части участников АС о параметрах самой АС. Рассмотрим случай асимметричной информированности без сообщения информации39. Так как исследователь операций стоит на позициях оперирующей стороны - центра, то обычно предполагается, что он менее информирован, чем активные элементы.
Пусть внутренними параметрами, неизвестными центру, являются параметры {г^} функций затрат АЭ: Ci(y, r,), i е I. То есть будем считать, что на момент принятия решений (выбора действия при известной функции стимулирования) i-ый АЭ знает истинное значение параметра г,, а центр как на момент принятия решений (то есть на момент выбора функции стимулирования), так и в дальнейшем , не знает его, а имеет некоторую информацию.
В зависимости от той информации, которой обладает центр, различают интервальную неопределенность (когда центру известно множество [d,; D,] возможных значений параметра г,, i е I), вероятностную неопределенность (когда центру дополнительно известно вероятностное распределение Piir,), ie I) и нечеткую неопределенность (когда центр имеет нечеткую информацию - знает функцию принадлежности параметра: P, : [d;-; D,] (r) [0; 1], i е I).
Рассмотрим последовательно три случая: интервальной, вероятностной и нечеткой внутренней неопределенности участников при асимметричной информированности.
7.1.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ
Пусть в "-элементной АС типа S4 функции затрат АЭ имеют вид: ci(y, Г,), i е I, а относительно параметров Г, центру известны множества = [d,; D,] их допустимых значений. Равновесие Нэша г), где г = (г/, г2, г"), естественно, зависит от истинных значений параметров функций затрат и используемой центром системы стимулирования:
(1) EN(O, г) = ^ е A' | V i е I, " у, е A,
S(^) - с,(у^, г,) > siy-i, у,) - c,(y-i, у,, г,)}.
Обозначим W = П . Определим эффективность системы
ieI
стимулирования s е M. Если при использовании центром системы стимулирования s и при векторе г параметров функций затрат АЭ множество равновесий Нэша есть EN(o, г), то в рамках гипотезы благожелательности эффективность стимулирования K(s) равна максимальному (по множеству равновесий Нэша) значению целевой функции центра. Это значение зависит от неопределенного параметра г е W. Используя для устранения этой неопределенности МГР, получаем:
(2) K(s) = min max {H(y) - ^ с, (у, г^)}.
геО yeE^ (s ^г)
Решение задачи K(s) (r) max, где K(s) определяется выраже-
s еМ
нием (2), является достаточно сложной задачей. Поэтому воспользуемся методом анализа минимальных затрат на стимулирование совместно с идеей декомпозиции игры АЭ.
Фиксируем некоторый вектор действий у е A'. Из результата теоремы 4.4.1 следует, что, если бы вектор г был известен, то минимальные затраты на стимулирование по реализации вектора действий у е A' равнялись бы следующей величине:
(3) ^(у: г) = X с, (у г,).
ieI
Оптимальное решение задачи синтеза оптимальной системы стимулирования в условиях интервальной неопределенности дается следующей теоремой.
101

л ^ Ч с- *
max ci (y*• у-i ^ гг ) + di ^ у, = у*
г , i е I,
Теорема 7.1.1. Система стимулирования (с параметром у (4) s, (у: у) =
0• у, ^ у,
* *
где оптимальное значение уг параметра у является решением задачи:
(J) у Г = aгg max {Н(у) - Ьг(у)}, где
yeA
(6) ^г(у) = X max с, (у, г^ ),
leI геО,
d-оптимальна.
Доказательство. Из доказательства теоремы 4.4.1 следует, что
для того, чтобы действие у* было доминантной стратегией i-го
АЭ, следует использовать компенсаторную систему стимулирования (см. выражение (1б) в разделе 4.4 выше). Кроме этого, для
*
того, чтобы побудить i-го АЭ выбрать действие у^ необходимо,
как минимум, компенсировать ему затраты (условие индивидуальной рациональности). Максимально возможные (в рамках существующей информированности центра) затраты АЭ при выборе этого
действия (и при обстановке игры У-1) равны max с^ (у*, У-1. , г^),
ГieWi
i е I.
Следовательно система стимулирования (4) гарантированно
" * л !
реализует вектор действий у е A' с минимальными затратами центра на стимулирование, определяемыми выражением (6).
Имея минимальные затраты по гарантированной реализации произвольного вектора действий АЭ, можно решить задачу оптимального согласованного планирования, то есть найти допустимый
вектор действий уГ , который доставляет максимум разности между функцией дохода центра и его затратами на стимулирование по гарантированной реализации этого вектора действий (см. выражение (5)). •
Отметим, что сравнение выражений (3) и (6) позволяет предложить следующий "качественный" метод решения задач стиму-
102

лирования в многоэлементных АС с внутренней интервальной неопределенностью и асимметричной информированностью: следует в качестве затрат АЭ рассматривать максимально возможные его (в рамках имеющейся информированности центра) затраты, после чего задача сводится к детерминированной задаче стимулирования в модели S4, методы решения которой подробно описаны в разделе 4.4.
Исследуем роль неопределенности, то есть ее влияние на гарантированную эффективность стимулирования. Понятно, что, если неопределенность отсутствует, то есть W* = Г*, i е I, то результат теоремы 7.1.1 переходит в результат теоремы 4.4.1.
Напомним, что в случае интервальной неопределенности критерием сравнения информированностей центра служит вложенность множеств возможных значений неопределенных параметров [44].
Следствие 7.1.2. С ростом неопределенности гарантированная эффективность стимулирования (в многоэлементной АС с внутренней интервальной неопределенностью и асимметричной информированностью) не возрастает. С уменьшением неопределенности гарантированная эффективность стимулирования возрастает и стремится к гарантированной эффективности стимулирования в соответствующей детерминированной модели.
Справедливость утверждения следствия следует из сравнения выражений (3) и (6) и теоремы о минимальных затратах на стимулирование [42].
Пример 10. Пусть в АС имеются два АЭ со следующими i у + a у . )2
функциями затрат: С.СУ) = -i -i-, i = 1, 2, где a < 1 - неко-
2гг
торый параметр (см. также для сравнения примеры 4 и 8). Пусть функция дохода центра Н(у) = y/ + у2. Предполагая существование внутреннего решения, получим следующую зависимость оптимальных с точки зрения центра действий АЭ от параметров их функций затрат:
(.) у* = ^, i=1. 2. *
Максимальное значение целевой функции центра Ф зависит
103
от вектора г неопределенных параметров следующим образом: (5) Ф*(г) = (г1 + г^):^ •
Из выражения (8) следует, что максимальное значение целевой функции центра монотонно по г. В то же время, функции затрат АЭ убывают с ростом г, поэтому при вычислении МГР целевая функция центра минимизируется на множестве возможных значений г е W. Снижение неопределенности соответствует уменьшению множества W. С уменьшением множества, по которому вычисляется минимум, значение самого минимума не уменьшается. Следовательно, с увеличением информированности центра гарантированная эффективность стимулирования не убывает. •
7.1.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ
Пусть в "-элементной АС типа S4 функции затрат АЭ имеют вид: С.СУ, Г.), i е I, а относительно параметров Г* центру известны множества W* = [d*; D,] их допустимых значений и распределения вероятностей р1(г1), с носителем W*. Обозначим р(г), г е W, - распределение вектора параметров функций затрат АЭ, и для определенности предположим, что "у е A' функции с1(у, г.) непрерывны и убывают по г., i е I.
Рассмотрим возможные подходы к определению эффективности системы стимулирования s е М. Так как, помимо диапазона возможных значений параметра функции затрат АЭ, центру известно его вероятностное распределение, то в соответствии с принципами устранения неопределенности, приведенными в [44], рациональность поведения центра будет заключаться в вычислении и максимизации математического ожидания своей целевой функции, то есть в использовании оценки ожидаемой полезности. Вся проблема заключается в согласовании определения ожидаемой полезности с определением решения игры АЭ (в одноэлементных АС такая проблема, естественно, не возникала).
Предположим, что центр использует в рамках ГБ следующую оценку эффективности системы стимулирования s е М:
104
(1) K(s) = max {Н(у) - s(y)} р(г) dг.
W уеЕ^ (s ^г)
Однако, использование усреднения по множеству равновесий
Нэша (максимум max в выражении (1) стоит под интегралом)
уеЕ^ (s ^г)
неправомочно по следующей причине. Пусть мы определили систему стимулирования, максимизирующую (1). При ее использовании центром в общем случае может оказаться, что параметры функций затрат АЭ таковы, что действие, на котором достигается максимум подынтегрального выражения не будет являться равновесием Нэша40 при данных функциях затрат и данной функции стимулирования. Примером может служить случай, когда центр компенсирует АЭ затраты, то есть использует систему стимулирования с параметром г, оптимальную при каждом фиксированном значении этого параметра (см. выражение (1б) в разделе 4.4.1 и выражения (3)-(6) в разделе 7.1.1). Следовательно, необходимо другое (отличное от (1)) определение эффективности системы стимулирования.
Можно рассмотреть случай, когда центр определяет эффективность системы стимулирования следующим образом. Обозначим Fi(гi) - соответствующую плотности Pi(гi) интегральную функцию распределения, i е I. Пусть центр использует следующую "компенсаторную" систему стимулирования:
(2) si tv', у, ,) = |с1( у'',у -г, 'г) + di yi= , i е I.
[ 0• у, * у,
Тогда, в рамках введенного выше предположения о монотонном убывании функций затрат с ростом значения неопределенного параметра и предположений А.1 - А.3, введенных в разделе 2, i-ый АЭ с вероятностью (1 - F-i',)) выбирает действие, совпадающее с у* (так как в этом случае его затраты не больше, чем с^(у , ',)), и с вероятностью F.i',) - нулевое действие. Следовательно, для фиксированного вектора действий у* е A' можно определить оптимальное (с точки зрения эффективности и риска) значение , i е I, а
затем уже решать задачу выбора оптимального вектора действий АЭ.
Описанная схема принятия решений (центром) в условиях неопределенности кажется несколько неестественной, поэтому можно рекомендовать использовать для устранения неопределенности принцип МГР (фактически, отказываясь от части информации41, то есть заменять вероятностную неопределенность интервальной) или использовать механизмы с сообщением информации (см. замечание выше).
7.1.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ
Пусть в "-элементной АС типа S4 функции затрат АЭ имеют вид: с.Су, г,), i е I, а относительно параметров г* центру известны множества Wi = [di; Di] их допустимых значений и функции принадлежности р)^ (г*), с носителем W*, р)^: W* (r) [0; 1], i е I.
Если определять эффективность стимулирования непосредственно с использованием нечетких информационных функций, то возникнут проблемы, аналогичные описанным выше для случая вероятностной неопределенности в разделе 7.1.2, что приведет к необходимости использования пессимистичных оценок, то есть принципа МГР. Поэтому рассмотрим альтернативный подход.
Имея информацию о четкой функции затрат АЭ с.Су, г.) (с точностью до значения параметра г,), можно, в соответствии с принципом обобщения [35, 44], определить нечеткую функцию затрат АЭ: с,. (у, u), с,.: A' х Х1 (r) [0; 1], i е I.
Введем следующее определение (по аналогии с тем как это делалось в [34] для нечеткой функции дохода): нечеткая функция затрат с,- (у, и) согласована^ с четкой функцией затрат с.Су), если "у е A', i е I выполнено:
1) ˜i (у, с(у)) = 1;
2) " U/, U2: u/ ? U2 ? с(у) с,- (у, и1) ? с,- (у, U2);
3) " u/, и2: с(у) ? u/ ?и2 с,-(у,и1) > с,-(у,U2). Предположим, что всем АЭ известны четкие функции дохода
{с.Су)}, удовлетворяющие предположениям А.1-А.3 (см. раздел 2), а центру известны нечеткие функции затрат АЭ { с* (у, и) }, согласованные с соответствующими четкими функциями затрат.
Если нечеткие функции затрат с,- (у, и), i е I, таковы, что
"у е A' равенство с* (у, и) = 1 выполнено тогда и только тогда, когда и = с(у) и функции { с,- (у, и) } согласованы с соответствующими четкими функциями затрат, то, очевидно, получается четкая (детерминированная) задача, для которой может быть использован результат теоремы 4.4.1.
Введем рассмотрение следующие четкие "функции затрат"2:
(1) с^^^Су) = max {и е Х42 | с, (у, и) = 1}, i е I.
Обозначим
(2) = X сГ(у) .
leI
Теорема 7.1.3. Система стимулирования (с параметром у*): (.) si (у*, у) = |0"<у*,у-г " + dг, ^г = ^^ , i е I,
I0, у,- * у,
**
где оптимальное значение уГ параметра у является решением задачи:
(4) у Г = aгg max {Н(у) - Ьг(у)},
уеЛ
d-оптимальна.
Доказательство. Из доказательства теоремы 4.4.1 (см. также доказательство теоремы 7.1.1) следует, что для того, чтобы действие у* было доминантной стратегией i-го АЭ, следует использовать компенсаторную систему стимулирования (см. выражения (1б) в разделе 4.4 и выражение (4) в разделе 7.1).
Кроме этого, для того, чтобы побудить i-ый АЭ выбрать действие у* необходимо, как минимум, компенсировать ему затраты
(условие индивидуальной рациональности). Из предположения о том, что нечеткие функции затрат АЭ, известные центру, согласованы с их четкими функциями затрат, и выражения (1) следует, что оценка сверху возможных (в рамках существующей информированности центра) затрат АЭ при выборе этого действия (и при
обстановке игры у-1) равны с(tm)^^ (у* , у-1) , i е I.
Следовательно система стимулирования (3) гарантированно реализует вектор действий у е A' с минимальными затратами центра на стимулирование, определяемыми выражением (2).
Имея минимальные затраты по гарантированной реализации произвольного вектора действий АЭ, можно решить задачу оптимального согласованного планирования, то есть найти допустимый
вектор действий уГ , который доставляет максимум разности между функцией дохода центра и его затратами на стимулирование по гарантированной реализации этого вектора действий (см. выражение (4)). •
Исследуем роль неопределенности. Понятно, что, если неоп-
108
- 1, 'i = г
ределенность отсутствует, то есть p^ ('*) = ' ^^ ^ * е I, (при
_ 1, и = с^ (у)
этом с* (у, и) = < , i е I), то результат теоремы 7.1.3
I0, и * сг (у)
переходит в результат теоремы 4.4.1.
Напомним, что в случае нечеткой неопределенности критерием сравнения информированностей центра служит вложенность нечетких множеств неопределенных параметров [44]. Другими
словами, при нечеткой функции затрат АЭ с 1i (у, и) информированность центра меньше, чем при нечеткой функции затрат АЭ сс 2i ( у, и) , если выполнено: (J) "у е A', Vи е Х1 с1,(у,и) > с2,(у,и) .
Следствие 7.1.4. С ростом неопределенности гарантированная эффективность стимулирования (в многоэлементной АС с внутренней нечеткой неопределенностью и асимметричной информированностью) не возрастает. С уменьшением неопределенности гарантированная эффективность стимулирования возрастает и стремится к гарантированной эффективности стимулирования в соответствующей детерминированной модели.
Справедливость утверждения следствия следует из теоремы о минимальных затратах на стимулирование [42] с учетом того, что, если выполнено (5), то, очевидно, имеет место следующее соотношение: C:1max(y) > c2max(y), i е I.
Пример 11. Пусть в АС имеются два АЭ со следующими
функциями затрат: с-Су, г,) = (У- +a У-1 ) , * = 1, 2, где a < 1 -
2гг
некоторый параметр (см. также для сравнения примеры 4, 8 и 10). Пусть функция дохода центра Н(у) = y/ + у2, а нечеткая функция затрат имеет вид:
(6) с, , |1, и е [с,.(у,D,);с,(у,d,)] . ^ (6) с. (у, и) = < , г е I,
^ ' [0, и ^ [с,. (у, D,); с,. (у, d^)]
где d* ?D*, i е I, - некоторые константы.
109
В соответствии с выражением (1) вычисляем: сГ'Су) = с-Су, d), i е I. Замечая, что мы оказались в условиях примера 10, воспользуемся
выражением (8) из раздела 7.1.1 и вычислим: Ф* = (d1 + d2) --a.
1 + a
Таким образом, результаты, полученные для интервальной и для нечеткой внутренней неопределенности, согласованы. •
7.2. ВНЕШНЯЯ НЕОПРЕДЕЛЕННОСТЬ
Под внешней неопределенностью понимают неполную информированность части участников АС о параметрах окружающей среды (состоянии природы), то есть параметрах, внешних по отношению к рассматриваемой АС. Рассмотрим случай симметричной информированности участников АС относительно неопределенных факторов, при которой и центр, и АЭ имеют одинаковую информацию о состоянии природы, но, быть может, асимметрично информированы относительно других показателей функционирования АС.
Пусть затраты АЭ с.Су), i е I, несепарабельны, зависят от действий АЭ и достоверно известны центру43.
Неопределенность (неполная информированность) участников АС относительно состояния природы учитывается в модели следующим образом.
Будем считать, что действия АЭ у = (y/, у2, ..., у") е A' совместно с состоянием природы в = (в/, в2, в") е W приводят к тому, что реализуется некоторый результат деятельности АС Z = (21, Z2,., z") е Ao, причем каждая компонента результата деятельности z* е A0., i е I, A0 = ^ A0. , зависит от действий всех АЭ 1 leI 1 и соответствующей компоненты состояния природы, то есть имеет место:
(1) Zi = z,(y, в), i е I,
где функции ("технологические" зависимости [9, 59]) {z.-i , )},
наряду с допустимыми множествами в* е О*, W = ^ W* , известны
leI
центру и всем АЭ.
Относительно целевых функций и допустимых множеств, дополнительно к предположениям А.1-А.4, примем следующее предположение:
А.7.1. " i е I A0i = A*; зависимости z.ty, в.) непрерывны по
всем переменным и однозначны.
Содержательно, предполагается, что множества возможных действий и результатов деятельности каждого АЭ совпадают. Наиболее распространенной (см. [44]) интерпретацией такого предположения является представление состояния природы как, например, аддитивной "помехи", накладываемой на действие АЭ.
Порядок функционирования и информированность участников АС следующие: центр сообщает АЭ систему стимулирования {si(z)}, то есть совокупность зависимостей индивидуальных вознаграждений АЭ от результата деятельности АС, после чего АЭ выбирают свои действия, ненаблюдаемые для центра44. Принципиально важно, что в рассматриваемой модели ни центр, ни АЭ, на момент выбора стратегий не знают значения состояния природы, которое реализуется после выбора ими стратегий и приведет к некоторому (единственному в силу предположения А.7.1) результату деятельности. Наблюдаемый и центром, и АЭ результат деятельности определяет вознаграждение АЭ и доход центра.45
Опишем целевые функции участников АС. Целевая функция центра представляет собой разность между доходом, зависящим от действий АЭ46, и суммарными затратами на стимулирование:
(2) F(z, у) = Н(у) - X s i (z).
leI
Целевая функция АЭ есть разность между его вознаграждением и затратами, зависящими в силу несепарабельности от действий всех АЭ:
(3) fiz, у) = s(z) - с-Су), i е I.
Отметим, что целевые функции участников АС зависят как от выбираемых ими стратегий (функций стимулирования и действий), так и от неопределенных факторов (результатов деятельности, которые действительно являются неопределенными, так как зависят от состояния природы). Поэтому необходимо конкретизировать принципы рационального поведения участников АС, то есть принципы выбора ими стратегий в условиях имеющейся неопределенности. Для этого необходимо четко определить, какой информацией о состоянии природы они обладают.
В зависимости от той информации, которой обладает участник АС (центр и АЭ), различают интервальную неопределенность (когда известно множество Oi возможных значений параметра в^, i е I), вероятностную неопределенность (когда дополнительно известно вероятностное распределение р1(в1), 1е I) и нечеткую неопределенность (когда имеется нечеткая информация - функция принадлежности состояния природы параметра: P*: О* (r) [0; 1],
i е I) (ниже последовательно рассматриваются три случая: интервальной, вероятностной и нечеткой внешней неопределенности
участников АС при симметричной их информированности).
Вернемся к обсуждению рационального поведения. В соответствии с общей методологией принятия решений в условиях неопределенности [42, 44, 66] игроки устраняют неопределенность с использованием всей имеющейся у них информации, сводя тем самым задачу принятия решений к детерминированной. Интервальная неопределенность устраняется, как правило, применением принципа МГР, вероятностная неопределенность - переходом к ожидаемой полезности (вычислением математического ожидания полезности (целевой функции) по известному распределению вероятности), нечеткая неопределенность - переходом к НОП, индуцированному на множестве допустимых действий целевой функцией АЭ (3) и нечеткой информационной функцией P [44].
Прежде чем переходить к изучению многоэлементных АС с внешней неопределенностью, рассмотрим детерминированный аналог предложенной модели, который в дальнейшем будет являться той "точкой отсчета", для которой будет проверяться выполнение принципа соответствия, относительно которой будет изучаться роль неопределенности и т.д. (см. введение к настоящему разделу).
Итак, предположим, что участники АС на момент принятия решений имеют достоверную информацию о состоянии природы. Запишем определение равновесия Нэша (решения игры АЭ), которое зависит от используемой центром системы стимулирования и состояния природы:
(4) EN(S, в) = {у" е A' | " i е I, "у, е A,
Sl(Z/(yN, в/), z2(yN, в2), zniy", вп)) - с-СУ") >
> Sl(Z/( y-i , Уг, в/), z2( У -i , Уг, в2), z"( у-. , у,, в")) - с,, у-. , у,)}.
В условиях полной информированности представляют интерес следующие варианты:
Вариант 1. Функция дохода центра и функции затрат АЭ зависят от действий АЭ, которые наблюдаются всеми участниками АС;
Вариант 2. Функция дохода центра зависит от наблюдаемого им результата деятельности АС, а функции затрат АЭ - от их действий, которые ненаблюдаемы для центра;
113
Вариант 3. Функция дохода центра и функции затрат АЭ зависят от действий АЭ, которые ненаблюдаемы для центра.
Первый вариант, как отмечалось выше, тривиален - центр может основывать стимулирование на наблюдаемых действиях, то есть получаем в точности детерминированную модель S4.
Рассмотрим второй вариант. Фиксируем произвольный вектор у е A' действий АЭ. Тогда рассматриваемая модель (при фиксированном г е О) принадлежит классу S6 моделей многоэлементных детерминированных АС, в которых стимулирование каждого АЭ зависит от результата деятельности АС, определяемого (в условиях отсутствия неопределенности) действиями АЭ при несе- парабельных затратах. Специфика рассматриваемой модели заключается в том, что оператор Q( j в ней имеет следующий "векторный" вид: Q: A' х О (r) A0, или в "поэлементном" представлении: Q,-: A' х О* (r) A0i, i е I, причем значение (в каждом
конкретном случае) состояния природы является параметром.
Определим Y(z, в) = {у е A' | z(y, в) = z} с A', z е A0 - множество тех действий АЭ, выбор которых при данном состоянии природы приводит к реализации заданного результата их деятельности z е A0. При компенсации центром затрат активных элементов минимальные затраты на стимулирование по реализации результа-
п
та деятельности z е A0 равны: ^(z, в) = min X с.-Су,), а целевая
yeY (z•в) ^
функция центра равна: F(z, в) = H(z) - J(z, в).
В соответствии с результатами раздела 4.6 на первом шаге решения задачи стимулирования определим множество векторов действий АЭ, приводящих к заданному результату деятельности и требующих минимальных затрат на стимулирование по своей
п
реализации: Y*(z, в) = Aгg min X с.Су). Фиксируем произволь-
yeY (z•в) l=1
ный вектор y*(z, в) е Y*(z, в) с Y(z, в). Тогда при использовании центром системы стимулирования
(5) sz) = |сг<у>),z = >, i е

стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>