стр. 1
(всего 5)

СОДЕРЖАНИЕ

>>

Д.А. Новиков

МЕХАНИЗМЫ СТИМУЛИРОВАНИЯ
В ОРГАНИЗАЦИОННЫХ СИСТЕМАХ

Настоящая работа является учебным пособием для подготовки
к экзамену по курсу "Механизмы стимулирования" для аспиран-
тов, обучающихся по специальности 05.13.10 – "Управление в
социальных и экономических системах" (см. программу курса и
задачи к экзамену на сайте www.mtas.ru).

СОДЕРЖАНИЕ

1. Введение ....................................................................................................... 2
ЧАСТЬ 1. ИНДИВИДУАЛЬНОЕ СТИМУЛИРОВАНИЕ............................ 9
2. Задача стимулирования в теории управления ........................................... 9
3. Модель теории контрактов ....................................................................... 29
4. Проблема стимулирования в экономике труда ....................................... 39
ЧАСТЬ 2. БАЗОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ ........................ 48
5. Формы и системы индивидуальной заработной платы и их
математические модели................................................................................. 57
6. Эффективность базовых систем стимулирования .................................. 65
ЧАСТЬ 3. КОЛЛЕКТИВНОЕ СТИМУЛИРОВАНИЕ................................ 87
7. Коллективное стимулирование за индивидуальные результаты........... 87
8. Стимулирование за результаты коллективной деятельности .............. 100
9. Унифицированные системы стимулирования....................................... 106
10. «Бригадные» формы оплаты труда....................................................... 112
11. Шкалы оплаты труда ............................................................................. 119
12. Ранговые системы стимулирования ..................................................... 128
13. Механизмы стимулирования в матричных структурах...................... 138
14. Литература.............................................................................................. 146
1. ВВЕДЕНИЕ

Организации и стимулирование. В соответствии с опреде-
лением, данным в Философском энциклопедическом словаре,
организация (организационная система) – «объединение людей,
совместно реализующих некоторую программу или цель и дейст-
вующих на основе определенных процедур и правил». Совокуп-
ность процедур, правил и т.д., регламентирующих взаимодействие
участников организационной системы (ОС) называется механиз-
мом ее функционирования1 [1, 12]. Важнейшей составляющей
механизма функционирования является механизм управления –
совокупность процедур принятия управленческих решений [1].
Условия деятельности каждого субъекта в общем случае мож-
но условно разделить на ограничивающие и побуждающие. Огра-
ничивающие условия деятельности обусловлены принадлежно-
стью к государству, нации, социальной группе, организации и т.д.
и могут рассматриваться как институциональные. Среди них –
система законов и норм, регламентирующих деятельность, начиная
от законодательной системы и заканчивая «неписанными» закона-
ми и морально-этическими нормами. Они устанавливают систему
ограничений, в рамках которой может осуществляться деятель-
ность, разрешая или поощряя то, что не противоречит этой системе
ограничений.
Побуждающие условия деятельности носят более персонифи-
цированный характер и направлены на целенаправленное (то есть
соответствующее целям и интересам отдельной личности, группы
или коллектива, организации и т.д.) побуждение субъекта (или,
опять же, группы, коллектива и т.д.) к совершению определенных
действий. Каждый субъект, обладающий, в свою очередь, собст-
венными целями и интересами, стремится к выбору действий,
которые, с одной стороны, максимально соответствуют его целям и
интересам, а, с другой стороны, удовлетворяют внешним и внут-
ренним (ограничивающим) условиям деятельности.


1
Именно наличие механизма функционирования отличает организацию от
коллектива (объединения людей, осуществляющих совместную деятельность) и
группы (совокупности людей, объединенных общностью интересов).
2
Одной из разновидностей целенаправленных внешних побуж-
дающих воздействий (создания условий деятельности) является
стимулирование (от латинского stimulus – остроконечная палка,
которой погоняли животных) – «внешнее воздействие на организм,
личность или группу людей, побуждение к совершению некоторо-
го действия» (см. Психологический словарь). Описание стимули-
рования включает: изучение поведения в отсутствии побуждения,
анализ возможных реакций на те или иные воздействия, поиск
допустимых воздействий, обеспечивающих совершение требуемых
действий.
Последний аспект соответствует управлению, понимаемому
как воздействие на управляемую систему с целью обеспечения
желательного ее поведения. При этом в социально-экономических
системах характерной чертой стимулирования, как разновидности
управления, является необходимость согласования интересов
управляющего и управляемого субъектов.
В настоящей работе стимулирование рассматривается именно
с управленческой точки зрения (в том числе – при фиксированных
институциональных ограничениях) и понимается в общем случае
как комплексное целенаправленное внешнее воздействие на ком-
поненты деятельности управляемой системы и процессы их фор-
мирования [11].
Следовательно, механизм стимулирования (систему стимули-
рования) можно определить как процедуру (правило) принятия
управляющим органом решений относительно побуждения управ-
ляемых субъектов к совершению требуемых действий. Наиболее
подробно изученной (и распространенной на практике) разновид-
ностью стимулирования является материальное стимулирование –
оплата труда. Поэтому, если не оговорено особо, под стимулиро-
ванием будем понимать именно материальное стимулирование.
Стимулирование с точки зрения различных наук. Стиму-
лирование изучается в таких областях науки как экономика, пси-
хология, управление и др. По «масштабу» рассмотрения и приме-
няемым методам можно выделить следующие взаимосвязанные
подходы (см. ссылки в [8]):
- «макроэкономический», в котором в центре внимания нахо-
дится рынок труда;

3
- «микроэкономический», в котором акцент делается на рас-
смотрении стимулирования в рамках организации (предприятия,
ведомства, фирмы и т.д.), причем основой является анализ именно
экономической деятельности (как индивидуальной, так и коллек-
тивной);
- «агентный», в котором центром рассмотрения является че-
ловек, группа, коллектив и т.д. с их потребностями и интересами.
Рассмотрим перечисленные подходы более подробно. Для их
описания удобно использовать следующую качественную модель.
Выделим трех участников трудовых отношений (см. рисунок
1). Первый (управляемый) субъект – конкретный индивидуум,
субъект (быть может, коллективный), например, работник, коллек-
тив отдела и т.д., предложением которого является труд, за кото-
рый он поощряется. Условно управляемого субъекта в дальнейшем
будем обозначать термином «агент».
Второй (управляющий) субъект – «работодатель», то есть ор-
ганизация, предприятие, ведомство, фирма и т.д., которых мы
будем обобщенно обозначать термином «центр», является «потре-
бителем» труда агента, преобразуя его в некоторый товар (продук-
ты, услуги и т.д.), обладающий рыночной стоимостью. Поставляя
товар на рынок, центр получает некоторый доход.
И, наконец, третий объект – «рынок» (будем считать, что ры-
нок не обладает собственными интересами) как институт обмена
правами собственности (в данном случае имеются в виду товар-
ный, фондовый и др. рынки, но не рынок труда), является «потре-
бителем» товара центра.


ТОВАР
ТРУД


Центр Рынок
Агент



ДОХОД
ВОЗНАГРАЖДЕНИЕ

Рис. 1. Участники трудовых отношений

4
Итак, агент обменивает свой труд на вознаграждение со сто-
роны центра1, вступая тем самым во взаимоотношения с другими
участниками рынка труда; а центр «обменивает» на рынке товар,
созданный с использованием труда агента, на доход (см. рисунок
1).
Как отмечалось выше, в рамках настоящей работы нас интере-
суют вопросы стимулирования, в частности – оплаты труда. Для
того чтобы ответить на вопрос, является ли то или иное вознагра-
ждение допустимым и желательным с точки зрения агента и цен-
тра, следует определить их предпочтения.
Под предпочтениями центра (агента) мы будем понимать со-
вокупность его свойств и способностей по определению индивиду-
альной ценности, полезности и т.д. различных альтернатив. В
первом приближении можно считать, что центр заинтересован в
максимизации прибыли (то есть его система предпочтений такова,
что альтернативы, соответствующие большим значениям «прибы-
ли», более предпочтительны), а агент – в максимизации некоторой
субъективной полезности, зависящей от показателей труда и вели-
чины вознаграждения (то есть система предпочтений агента тако-
ва, что она позволяет ему «сравнивать» различные комбинации
труда и вознаграждения).
Введя предположение о наличии предпочтений участников
трудовых отношений, для корректной постановки задачи поиска
величины вознаграждения агента со стороны центра осталось
определить, что является целью деятельности каждого из субъек-
тов, а что – ограничениями (внешними условиями) деятельности.
Именно в этот момент возникают несколько альтернатив, соответ-
ствующих различным подходам к исследованию стимулирования.
Будем считать, что каждый агент имеет свои представления о
минимальной оплате, которая с его субъективной точки зрения
соответствует его квалификации.
В рамках «макроэкономического» подхода предполагается,
что (для каждого агента) объективно существует рыночная зарпла-

1
Следует отметить, что в приводимых рассуждениях один и тот же агент
свободен в выборе работодателя, а работодатель – в выборе работника, поэто-
му можно условно считать, что на рисунке 1 изображена одна из возможных
комбинаций взаимодействия некоторых агента и центра.
5
та. Если зарплата, предлагаемая некоторым работодателем, не
ниже рыночной, то агент соглашается работать за данную оплату.
Ограничениями при этом являются экономическая эффективность
(выгодность с точки зрения прибыли центра) найма данного агента
и соответствие предлагаемой оплаты субъективным представлени-
ям агента. Подобный подход, в рамках которого условно можно
считать «основным» взаимодействие агента и рынка труда (см.
рисунок 2а), развивается в многочисленных работах по исследова-
нию предложения и спроса на рынке труда (см. ссылки в [8]).
На рисунке 2 (а, б и в) условно обозначены связи между рас-
сматриваемыми участниками трудовых отношений. Жирными
кружками (линиями) в каждом из случаев выделены те элементы
(связи), которые считаются «основными».


Центр Центр
Центр



Рынок Агент Рынок Агент Рынок
Агент


Рис. 2а. Рис. 2в.
Рис. 2б.
«Макроэкономи- «Агентный»
«Микроэкономи-
ческий» подход подход
ческий» подход

При «микроэкономическом» подходе «основным» является
взаимодействие центра и товарного рынка (см. рисунок 2б). Дру-
гими словами, центр нанимает конкретного агента, если его труд
приводит к созданию товара или услуги, реализация которых
приводит к максимальной прибыли. Ограничениями при этом
являются субъективные представления агента и его рыночная
зарплата. Задачи определения оптимальной (эффективной) зара-
ботной платы, оптимального числа нанимаемых работников и др.
рассматриваются в работах по теории фирмы, теории контрактов и
др. (см. ссылки в [8]).
Если в качестве «основного» рассматривается взаимодействие
агента с центром (см. рисунок 2в), то есть соответствие предлагае-
мого центром вознаграждения предпочтениям агента, то такой
6
подход считается агентным. Ограничениями при этом являются
экономическая эффективность (с точки зрения прибыли центра)
найма данного работника за данную оплату, а также рыночная
зарплата данного работника. Агентный подход рассматривается в
основном в работах по принятию решений, теории управления и
др. (см. ссылки в [8]).
Ниже в настоящей работе используется, в основном, агентный
подход, а именно считается, что агент соглашается на такие усло-
вия оплаты, которые являются наилучшими с точки зрения его
субъективных предпочтений. Такое решение будет допустимым,
только если оно выгодно для центра (обеспечивает ему допусти-
мую или максимально возможную в данных условиях прибыль) и
не нарушает рыночного равновесия (величина вознаграждения
данного агента не ниже его рыночной зарплаты).
В рамках агентного подхода, в зависимости от выделяемого
предмета исследования и используемых методов исследования
различают следующие направления:
- «менеджмента», как совокупности систематизированных
положений о наиболее эффективном управлении организацией,
носящих обобщающий, эмпирический и интуитивный характер1;
- «психолого-социологическое», исследующее процессы моти-
вации деятельности человека или в более общем случае – деятель-
ность групп и коллективов (см. ссылки в [8]);
- «математическое», изучающее формальные (математиче-
ские, имитационные и др.) модели – аналоги реальных систем (см.
ссылки в [8]).
Упомянутые направления и выделенные подходы взаимосвя-
заны и взаимно используют результаты и методы друг друга. Од-
нако, к сожалению, на сегодняшний день это взаимопроникнове-
ние недостаточно глубоко, и зачастую исследователи говорят на
разных языках, не осознавая возможности переноса результатов из
одной области исследований в другую.
Более того, несмотря на то, что большинство исследователей
отмечает многоаспектность стимулирования как составляющей
части мотивации, то есть наличие разнообразных форм, методов и
средств стимулирования, на сегодняшний день большинство работ

1
Сюда же можно включить и управление персоналом.
7
явно или неявно посвящено изучению материального стимулиро-
вания – таких поощрений или наказаний субъектов, которые могут
быть измерены в денежной форме. Помимо этого, многие резуль-
таты исследований стимулирования в «гуманитарных» областях
науки носят интуитивный характер и не всегда достигают жела-
тельного уровня строгости и формализации. Формальные же моде-
ли стимулирования, как отмечалось выше, изучаются в теории
управления.
Стимулирование в теории управления. Формальные (мате-
матические, точнее – теоретико-игровые) модели стимулирования
исследуются в рамках таких разделов теории управления социаль-
но-экономическими системами как: теория активных систем
[1, 11], теория иерархических игр [3], теория контрактов (см. ссыл-
ки в [8]) и др. Необходимость использования моделей обусловлена
сложностью, а зачастую и невозможностью проведения на соци-
ально-экономических системах натурного эксперимента. С одной
стороны, применение математических моделей в ряде случаев дает
возможность оценить эффективность различных механизмов
управления, провести игровое и/или имитационное исследование,
обучение управленческого персонала и т.д. С другой стороны, для
большинства существующих теоретических результатов, получен-
ных в упомянутых выше научных областях, характерен определен-
ный отрыв от практики: как вводимые предположения, так и полу-
чаемые выводы не всегда сопровождаются содержательными
интерпретациями или не доводятся до конструктивных приклад-
ных алгоритмов и методик.
Другими словами, наблюдается значительный разрыв между
теорией и практикой: с одной стороны, специалисты-практики
иногда даже не подозревают о том, что в теории управления нако-
плен значительный опыт анализа и синтеза формальных моделей
стимулирования; с другой стороны, специалисты-теоретики далеко
не всегда доводят свои результаты до этапа практического исполь-
зования, когда ими могут воспользоваться управленцы, не имею-
щие соответствующей математической подготовки.
Существующий разрыв отрицательно сказывается на обеих
областях – игнорирование последних достижений науки не позво-
ляет достичь высокой эффективности системы управления органи-

8
зацией, а отрыв от практики приводит к изоляции содержания
теоретических моделей.


ЧАСТЬ 1. ИНДИВИДУАЛЬНОЕ СТИМУЛИРОВАНИЕ

2. ЗАДАЧА СТИМУЛИРОВАНИЯ В ТЕОРИИ УПРАВЛЕНИЯ

Основным аппаратом построения моделей стимулирования
является теория игр – раздел прикладной математики, исследую-
щий модели принятия решений в условиях несовпадения интере-
сов сторон (игроков), когда каждая сторона стремится воздейство-
вать на развитие ситуации в собственных интересах [5].
Простейшей игровой моделью является взаимодействие двух
игроков – центра (principal) и подчиненного ему агента (agent). В
качестве центра может выступать непосредственный руководитель
агента или организация, заключившая трудовой (или какой-либо
иной – страховой, подрядный и др.) договор с агентом. В качестве
агента может выступать наемный работник или организация, яв-
ляющаяся второй стороной по соответствующему договору.
Перейдем к описанию базовой модели стимулирования, отра-
жающей взаимодействие одного начальника и одного подчиненно-
го.
Рассмотрим организационную систему (ОС), состоящую из
одного управляющего органа – центра – на верхнем уровне иерар-
хии и одного управляемого субъекта – агента на нижнем уровне.
Участники ОС, то есть центр и агент, обладают свойством актив-
ности – способностью самостоятельного выбора действий (страте-
гий).
Механизмом функционирования ОС называется совокупность
правил, законов и процедур, регламентирующих взаимодействие
участников системы. Механизмом стимулирования называется
правило принятия решений центром относительно стимулирования
агента. Механизм стимулирования включает в себя систему сти-
мулирования, которая в рамках моделей, рассматриваемых в на-
стоящей работе, полностью определяется функцией стимулирова-
ния, задающей зависимость вознаграждения агента от выбираемых
им действий. Поэтому в дальнейшем при рассмотрении теоретико-
9
игровых моделей будем употреблять термины «механизм стимули-
рования», «система стимулирования» и «функция стимулирова-
ния» как синонимы.
Стратегией агента является выбор действия y ? A, принадле-
жащего множеству допустимых действий A. Содержательно дейст-
вием агента может быть количество отрабатываемых часов, объем
произведенной продукции и т.д. Множество допустимых действий
агента представляет собой набор альтернатив, из которых он про-
изводит свой выбор. Например, диапазон возможной продолжи-
тельности рабочего времени, неотрицательный и не превышающий
технологические ограничения объем производства, уровень каче-
ства продукции и т.д.
Стратегией центра является выбор функции стимулирования
?(y) ? M, принадлежащей допустимому множеству M и ставящей в
соответствие действию агента некоторое неотрицательное возна-
граждение, выплачиваемое ему центром, то есть1 ? : A > ?1+.
Множество допустимых вознаграждений может ограничиваться
как законодательно (например, минимальным размером оплаты
труда), так и, например, соображениями экономической эффектив-
ности деятельности центра, тарифно-квалификационными требо-
ваниями к оплате труда данного агента и т.д.
Выбор действия y ? A требует от агента затрат c(y) и прино-
сит центру доход H(y). Функцию затрат агента c(y) и функцию
дохода центра H(y) будем считать известными (проблемы их
идентификации обсуждаются в [7, 8]).
Интересы участников организационной системы (центра и
агента) отражены их целевыми функциями, которые обозначим,
соответственно2, ?(?) и f(?) (функциями выигрыша, полезности и
т.д., в записи которых зависимость от стратегии центра будет
опускаться), представляющими собой: для агента – разность между
стимулированием и затратами
(1) f(y) = ?(y) – c(y);
а для центра – разность между доходом и затратами центра на
стимулирование – вознаграждением, выплачиваемым агенту:

Напомним, что запись «g: X > Y» обозначает отображение g множества X во
1

множество Y.
2
Напомним, что запись «g(?)» обозначает функцию g от некоторого аргумента.
10
(2) ?(y) = H(y) – ?(y).
Обсудим структуру целевых функций.
Во-первых, исходя из содержательных интерпретаций, функ-
цию H(y) правильнее было бы назвать «прибылью», а не «дохо-
дом». Тем не менее, будем следовать установившейся в теории
управления терминологии.
Во-вторых, расходы на оплату труда обычно составляют не-
значительную часть затрат организации (например, для промыш-
ленных предприятий – от 3 до 15 процентов). Тем не менее, с
точки зрения мотивации важна не относительная доля этих затрат,
а абсолютный размер вознаграждения, что обосновывает целесо-
образность их учета в целевой функции центра наряду с доходом.
В-третьих, используемое в настоящей работе представление
целевой функции агента в виде (1) – «стимулирование минус за-
траты» – не является единственно возможным. Так, существуют
модели, в которых предпочтения агента описываются разностью
между его доходом и штрафами, устанавливаемыми центром [11] –
так называемое представление «доход минус штрафы» (при этом
штрафы, выплачиваемые агентом, суммируются с доходом центра
в целевой функции последнего). Так как оба представления экви-
валентны (одно сводится к другому с помощью линейного преоб-
разования и замены переменных), то результаты исследования
одного представления предпочтений участников ОС непосредст-
венно переносятся и на другое представление.
После того как введены целевые функции, отражающие пред-
почтения участников ОС, целесообразно обсудить различия в
описании материального и нематериального стимулирования.
Наличие скалярной целевой функции подразумевает сущест-
вование единого эквивалента, в котором измеряются все слагаемые
целевых функций (затраты агента, доход центра и, естественно,
само стимулирование).
В случае, когда речь идет о материальном вознаграждении
агента, таким эквивалентом выступают деньги. Содержательные
интерпретации дохода центра при этом очевидны (более того,
практически во всех работах, содержащих описание формальных
моделей стимулирования, предполагается, что и стимулирование, и
доход центра «измеряются» в денежных единицах). Сложнее дело
обстоит с затратами агента, поскольку не всегда можно адекватно
11
выразить в денежных единицах, например, удовлетворенность
агента работой и т.д. С экономической точки зрения затраты агента
можно интерпретировать как денежный эквивалент тех усилий,
которые агент должен произвести для достижения того или иного
действия. В рамках такой интерпретации вполне естественной
выглядит идея компенсации затрат – вознаграждение со стороны
центра должно как минимум компенсировать затраты агента (см.
более подробно формальное описание в настоящем разделе ниже).
Если затраты агента измеряются в некоторых единицах «по-
лезности» (учитывающей, например, физическую усталость, мо-
ральное удовлетворение от результатов труда и т.д.), отличных от
денежных единиц (и несводимых к ним линейным преобразовани-
ем), то для того, чтобы иметь возможность складывать или вычи-
тать полезности при введении целевой функции типа (1), необхо-
димо определить полезность вознаграждения. Например, если
используется материальное стимулирование, то можно ввести
˜
функцию полезности u (? ( y )) , которая отражала бы полезность
денег для рассматриваемого агента. Целевая функция агента при
˜
этом примет вид f(y) = u (? ( y )) – c(y).
Также на практике распространен прием, заключающийся в
«линеаризации» функции дохода центра. При этом целевые функ-
ции участников ОС (1) и (2) примут, соответственно, вид:
) )
) )
) ) )
f (y) = ? (y) – c (y), ? (y) = y – ? (y), y ? A , ? ? M ,
) )
) )
где ? (?) = ?(H (?)), c (?) = c(H (?)), A = H (A), M = H -1(M),
-1 -1 -1

H -1(?) – функция, обратная функции H(?) дохода центра.
Введем следующие предположения, которых будем придер-
живаться, если не оговорено особо, в ходе дальнейшего изложения.
Во-первых, будем считать, что множество возможных дейст-
вий агента составляет положительную полуось. Отказу агента от
участия в ОС (бездействию) соответствует нулевое действие.
Во-вторых, относительно функции затрат агента предполо-
жим, что она не убывает, непрерывна, а затраты от выбора нулево-
го действия равны нулю (иногда дополнительно будем требовать,
чтобы функция затрат была выпукла и непрерывно дифференци-
руема).

12
В третьих, допустим, что функция дохода центра непрерывна,
неотрицательна, и доход центра в случае отказа агента от участия в
ОС (выборе последним нулевого действия) равен нулю.
Приведем содержательные интерпретации введенных предпо-
ложений.
Первое предположение означает, что выбор возможных дейст-
вий агента выражается величинами, представляющими собой
неотрицательные действительные числа, например, количество
отработанных часов, объем произведенной продукции и т.д.
Из второго предположения следует, что выбор больших дей-
ствий требует от агента не меньших затрат. Например, затраты
могут расти с ростом объема выпускаемой продукции. Кроме того,
нулевое действие (отсутствие деятельности агента) не требует
затрат.
Третье предположение накладывает ограничения на функцию
дохода центра, требуя, чтобы при выборе агентом нулевого дейст-
вия (что в силу второго предположения требует от последнего
нулевых затрат, то есть соответствует отсутствию взаимодействия
с центром) центр не имел дохода, но и не нес убытков. Отметим,
что это предположение несущественно для большинства приводи-
мых ниже рассуждений.
Рациональное поведение участника ОС заключается в макси-
мизации выбором собственной стратегии его целевой функции с
учетом всей имеющейся у него информации – так называемая
гипотеза рационального поведения [5] (ГРП).
Определим информированность участников ОС и порядок
функционирования1. Будем считать, что на момент принятия реше-
ния (выбора стратегии) участникам ОС известны все целевые
функции и все допустимые множества. Специфика теоретико-
игровой задачи стимулирования заключается в том, что в ней
фиксирован порядок ходов: центр обладает правом первого хода,
сообщая агенту выбранную им функцию стимулирования, после


1
Информированностью субъекта называется та информация, которой он
обладает на момент принятия решений. Порядком функционирования называет-
ся последовательность получения информации и выбора стратегий участниками
организационной системы.
13
чего при известной стратегии центра агент выбирает свое дейст-
вие, максимизирующее его целевую функцию.
Пример 1. В качестве примера рассмотрим упрощенную мо-
дель трудового контракта, заключаемого между работником
(агентом) и некоторой организацией (центром) и являющегося, как
правило, документом, в котором отражено следующее: центр
обязуется обеспечить условия работы и выплатить вознагражде-
ние, прямо или косвенно зависящее от результатов деятельности
(действий) агента. Помимо этого в контракте оговариваются права
и обязанности агента, в том числе – выбор каких действий он
может и обязуется производить и т.д.
Таким образом, стратегией центра является выбор системы
стимулирования, стратегией агента – выбор действия. Условия
контракта (его содержание) известны обеим сторонам. Информи-
рованность участников следующая. На момент принятия решений
(о том, какую систему стимулирования центру следует установить
для того или иного агента) центр имеет информацию о том, какие
действия этот агент может выбирать (множество его допустимых
(возможных) действий) и о предпочтениях агента (его целевой
функции) на этом множестве. Помимо этого центру, естественно,
известны свои собственные предпочтения и ограничения (в том
числе, институциональные) на множество допустимых функций
стимулирования. Агент на момент принятия решения о том, какое
действие ему следует выбрать, знает свои предпочтения и множе-
ство своих возможных действий, а также выбранную центром
систему стимулирования, то есть функциональную зависимость
вознаграждения от действий. Порядок функционирования сле-
дующий: заключается контракт, затем агент выбирает свое дейст-
вие, после чего производятся выплаты. •1
Так как значение целевой функции агента зависит как от его
собственной стратегии – действия, так и от функции стимулирова-
ния, то в рамках принятой гипотезы рационального поведения
агент будет выбирать действия, которые при заданной системе
стимулирования максимизируют его целевую функцию. Понятно,
что множество таких действий, называемое множеством реализуе-
мых действий, зависит от используемой центром системы стиму-
1
Символом «•» здесь и далее обозначается окончание примера.
14
лирования. Основная идея стимулирования как раз и заключает-
ся в том, что, варьируя систему стимулирования, центр может
побуждать агента выбирать те или иные действия.
Так как целевая функция центра зависит от действия, выби-
раемого агентом, то эффективностью1 системы стимулирования
является значение целевой функции центра на множестве действий
агента, реализуемых данной системой стимулирования. Следова-
тельно, задача стимулирования заключается в том, чтобы выбрать
оптимальную систему стимулирования – имеющую максимальную
эффективность. Приведем формальные определения.
Множество действий агента, доставляющих максимум его це-
левой функции (и, естественно, зависящее от функции стимулиро-
вания), называется множеством решений игры или множеством
действий, реализуемых данной системой стимулирования2:
(3) P(?) = Arg max {?(y) – c(y)}.
y?A
Зная, что агент выбирает действия из множества3 (3), центр
должен найти систему стимулирования, которая максимизировала
бы его собственную целевую функцию. Так как множество P(?)
может содержать более одной точки, необходимо доопределить (с
точки зрения предположений центра о поведении агента) выбор
агента. Если не оговорено особо, то в ходе последующего изложе-
ния будем считать выполненной гипотезу благожелательности
(ГБ), которая заключается в следующем: если агент безразличен
между выбором нескольких действий (например, действий, на
которых достигается глобальный максимум его целевой функции),
то он выбирает из этих действий то действие, которое наиболее
благоприятно для центра.

1
В экономике традиционно под «эффективностью» понимается отношение
эффекта к затратам. Мы же будем следовать сложившейся в теории управле-
ния терминологии, и называть эффективностью управления значение целевой
функции центра (в общем случае эффективность может определяться как
некоторый функционал над (?(?), f(?), ?(?), y)).
2
Всюду при использовании максимумов и минимумов предполагается, что они
достигаются.
3
Напомним, что запись «Arg max g(v)» обозначает множество глобальных
v?V
максимумов функции g(v) на множестве V.
15
Итак, в рамках ГБ агент выбирает из множества (3) наиболее
благоприятное для центра действие, следовательно, эффектив-
ность системы стимулирования ? ? M равна:
(4) K(?) = max ?(y)
y?P (? )

где ?(y) определяется (2).
Если отказаться от гипотезы благожелательности, то следует
вместо эффективности (4) стимулирования использовать гаранти-
рованную эффективность
Kg(?) = min ?(y).
y?P (? )

Прямая задача синтеза оптимальной системы стимулирования
заключается в выборе допустимой системы стимулирования,
имеющей максимальную эффективность:
(5) K(?) > max ,
? ?M
или максимальную гарантированную эффективность:
Kg(?) > max .
? ?M
Система стимулирования ? (?), являющаяся решением задачи
*

(5), то есть имеющая максимальную эффективность, называется
оптимальной1:
?*(?) = arg max K(?).
? ?M
*
Обозначим K* = K(?*), K g = max Kg(?). Очевидно, что
? ?M
K* ? K . В [11, 15] доказано, что, если целевые функции непре-
*
g

рывны, а допустимые множества компактны, то эффективность
*
K g гарантированно оптимальной системы стимулирования сколь
угодно близка к эффективности K* оптимальной системы стимули-
рования.
Обратная задача стимулирования заключается в поиске мно-
жества систем стимулирования, реализующих заданное действие,
или в более общем случае – заданное множество действий A* ? A.

1
Напомним, что запись «arg max g(v)» значение аргумента, на котором дости-
v?V
гается глобальный максимум функции g(v) на множестве V
16
Например, при A* = {y*} обратная задача может заключаться в
поиске множества M(y*) систем стимулирования, реализующих это
действие, то есть1 M(y*) = {? ? M | y* ? P(?)}. Определив M(y*),
центр имеет возможность найти в этом множестве «минимальную»
систему стимулирования, то есть реализующую заданное действие
с минимальными затратами на стимулирование, или систему сти-
мулирования, обладающую какими-либо другими заданными
свойствами, например – монотонность, линейность и т.д.
Следует отметить, что введенные выше предположения согла-
сованы в следующем смысле. Агент всегда может выбрать нулевое
действие, не требующее от него затрат (второе предположение) и
приносящее нулевой доход центру (третье предположение). В то
же время, центр имеет возможность ничего не платить ему за
выбор этого действия.
Во всех содержательных интерпретациях теоретико-игровых
моделей стимулирования предполагается, что у агента имеется
альтернатива – сохранить статус-кво, то есть не вступать во взаи-
моотношения с центром (не заключать трудового контракта).
Отказываясь от участия в данной ОС, агент не получает вознагра-
ждения от центра и всегда имеет возможность выбрать нулевое
действие, обеспечив себе неотрицательное (точнее – нулевое)
значение целевой функции. Если вне данной ОС агент может
гарантированно получить полезность U ? 0 (пособие по безрабо-
тице или резервную полезность – reservation wage utility) в терми-
нологии теории контрактов), то и при участии в данной ОС ему
должен быть гарантирован не меньший уровень полезности. С
учетом резервной полезности множество (3) реализуемых действий
примет вид
(6) P(?, U ) = Arg max {?(y) – c(y)}.
{ y? A | ? ( y ) ? c ( y ) + U }

Далее для простоты, если не оговорено особо, без ограничения
общности будем считать резервную полезность равной нулю.
Сделав маленькое отступление, обсудим более подробно мо-
дель процесса принятия решений агентом. Предположим, что

Напомним, что запись {v ? V| g(v) ? 0} обозначает множество таких v, при-
1

надлежащих множеству V, на которых функция g(?) принимает неотрицатель-
ные значения.
17
некоторый агент предполагает устроиться на работу на некоторое
предприятие. Ему предлагается контракт {?(y), y*}, в котором
оговаривается зависимость ?(?) вознаграждения от результатов y
его деятельности, а также то, какие конкретные результаты y* от
него ожидаются. При каких условиях агент подпишет контракт,
если обе стороны – и агент, и предприятие (центр) принимают
решение о подписании контракта самостоятельно и добровольно?
Рассмотрим сначала принципы, которыми может руководствовать-
ся агент.
Первое условие – условие согласованности стимулирования
(incentive compartibility constraint), которое заключается в том, что
при участии в контракте выбор именно действия y* (а не какого-
либо другого допустимого действия) доставляет максимум его
целевой функции (функции полезности). Другими словами, это –
условие того, что система стимулирования согласована с интере-
сами и предпочтениями агента.
Второе условие – условие участия в контракте (иногда его на-
зывают условием индивидуальной рациональности – individual
rationality constraint), которое заключается в том, что, заключая
данный контракт, агент ожидает получить полезность, большую,
чем он мог бы получить, заключив другой контракт с другой орга-
низацией (с другим центром). Представления агента о своих воз-
можных доходах на рынке труда отражает такая величина как
резервная заработная плата. Остановимся на ее рассмотрении
более подробно.
Пример 2. Предположим, что агент (безработный или соби-
рающийся сменить работу) имеет свои субъективные1 представле-
ния о распределении вероятностей предлагаемой на рынке труда
заработной платы (или ставки заработной платы2) [7, 17]. Обозна-
чим плотность этого распределения p(?), k* – уровень квалифика-


1
Необходимо помнить, что рассматривается модель поиска работы некоторым
конкретным агентом. Поведение других агентов в тех же условиях может
отличаться в силу различий их индивидуальных характеристик.
2
Ставка заработной платы при повременной оплате труда соответствует
вознаграждению за единицу времени (час, день, месяц и т.д.). Заработная плата
в этом случае определяется произведением ставки оплаты на продолжитель-
ность отработанного времени.
18
ции1 данного агента. Гипотетическая кривая распределения приве-
дена на рисунке 3.
Понятно, что в среднем более высокой квалификации соответ-
ствует более высокая оплата. Если бы агент обладал полной ин-
формацией о требованиях ?*(k) к квалификации, предъявляемых на
рынке труда для получения соответствующей заработной платы, и
если бы достоверная информация о его квалификации k* была
полностью доступна всем потенциальным работодателям (цен-
трам), то он был бы, фактически, лишен выбора и соглашался бы
на существующий однозначный рыночный уровень заработной
платы ?*(k*), соответствующий его квалификации. Проблема за-
ключается в том, что информация о рынке труда несовершенна, то
есть и агент, и центр действуют в условиях неполной информиро-
ванности.


p(?)




?
E?(k*)
0 ? * (k * )
U (k * )
Рис. 3. Резервная, ожидаемая и максимальная
заработная плата


Предположим, что агент имеет свои субъективные представ-
ления о минимальном уровне заработной платы U (k * ) , за которую
он согласен работать при данной его квалификации. Величина
1
Квалификацию в данном случае следует понимать в широком смысле – как
совокупность не только профессиональных, но и личностных качеств и навыков
(например, ответственность, организаторские способности, умение работать в
коллективе и др.).
19
U (k * ) называется резервной заработной платой. Тогда процесс
поиска работы можно представить себе следующим образом:
получая информацию о предлагаемых условиях работы и ее опла-
ты, агент соглашается с первым предложением, превышающим его
резервную заработную плату (в случае смены работы в качестве
резервной заработной платы может выступать, например, величина
зарплаты на старом месте работы или величина пособия по безра-
ботице и т.д.).
Так как агент не может получить заработную плату, превы-
шающую ?*(k*) (поэтому величину ?*(k*) иногда называют макси-
мальной заработной платой), то ожидаемая заработная плата
будет равна следующей величине:
? * (k * )

?? p (? ) d? .
*
E?(k ) =
*
U (k )

Более подробное обсуждение свойств резервной заработной
платы и моделей поиска работы можно найти в [17]. •
Вернемся к анализу условий взаимовыгодности заключения
трудового контракта.
Аналогичные (приведенным выше для агента) условия согла-
сованности и индивидуальной рациональности можно сформули-
ровать и для центра. Если имеется единственный агент – претен-
дент на заключение контракта, то контракт будет выгоден для
центра, если выполнены два условия.
Первое условие (аналогичное условию согласованности сти-
мулирования) отражает согласованность системы стимулирования
с интересами и предпочтениями центра, то есть применение имен-
но фигурирующей в контракте системы стимулирования должно
доставлять максимум целевой функции (функции полезности)
центра (по сравнению с использованием любой другой допустимой
системы стимулирования) – см. (4).
Второе условие для центра аналогично условию участия для
агента, а именно – заключение контракта с данным агентом выгод-
но для центра по сравнению с сохранением статус-кво, то есть
отказу от заключения контракта вообще. Например, если считать,
что прибыль предприятия (значение целевой функции центра) без

20
заключения контракта равна нулю, то при заключении контракта
прибыль должна быть неотрицательна.
Если претендентов на заключение контракта несколько, то
центру необходимо учитывать третье условие – наиболее выгодно
должно быть заключение контракта именно с данным (а не каким-
либо другим) агентом или множеством агентов.
Качественно обсудив условия заключения взаимовыгодного
трудового контракта, вернемся к формальному анализу, то есть
решению задачи стимулирования (4). Отметим, что решение дан-
ной задачи «в лоб» достаточно трудоемко. Но, к счастью, можно
угадать оптимальную систему стимулирования исходя из содержа-
тельных соображений, а затем корректно обосновать ее оптималь-
ность.
Легко видеть, что в рамках введенных предположений при
участии агента в рассматриваемой организационной системе ему
гарантируется как минимум нулевое значение полезности. Условие
неотрицательности полезности агента:
(7) ? y ? P(?) f(y) ? 0
является условием индивидуальной рациональности. Следователь-
но, как минимум, реализуемыми будут такие действия, при выборе
которых значения целевой функции агента будут неотрицательны
(см. (6)):
(8) P0(?) = {y ? A | ?(y) ? c(y)} ? P(?).
Предположим, что функция H(?) дохода центра – возрастаю-
щая и вогнутая (свойство убывающей предельной полезности), а
функция c(?) затрат агента – выпуклая (предельные затраты увели-
чиваются с ростом действия). На рисунке 4 изображены графики
функций: H(y) и (c(y) + U ). С точки зрения центра стимулирова-
ние не может превышать доход, получаемый им от деятельности
агента (так как, отказавшись от взаимодействия с агентом, центр
всегда может получить нулевую полезность). Следовательно,
допустимое решение лежит ниже функции H(y). С точки зрения
агента стимулирование не может быть меньше, чем сумма затрат и
резервная полезность (которую агент всегда может получить,
выбирая нулевое действие). Следовательно, допустимое решение
лежит выше функции (c(y) + U ).

21
Множество действий агента и соответствующих значений воз-
награждений, удовлетворяющих как для центра, так и для агента
одновременно всем перечисленным выше ограничениям (согласо-
вания, индивидуальной рациональности и др.) называется «об-
ласть компромисса» и заштрихована на рисунке 4. При этом реа-
лизуемыми оказываются действия агента из следующего
множества:
(9) S = {x ? A | H(x) – c(x) – U ? 0}.
Легко видеть, что при неизменных функциях дохода и затрат с
ростом величины U область компромисса вырождается.



c(y) + U
H(y)



A

B
U
y
y*
0

S

Рис. 4. Область компромисса в задаче стимулирования

Так как центр стремится минимизировать выплаты агенту, при
условии, что последний выбирает требуемое действие, то опти-
мальная точка должна лежать на нижней границе области компро-
мисса, то есть с точки зрения центра стимулирование в точности
должно равняться сумме затрат агента и резервной полезности.
Этот важный вывод получил в литературе название «принцип
компенсации затрат» [7, 11, 12, 14]. В соответствии с этим прин-
ципом, для того, чтобы побудить агента выбрать определенное
действие, центру достаточно, помимо резервной полезности, ком-


22
пенсировать затраты агента. Помимо компенсации затрат, центр
может устанавливать также мотивирующую надбавку1 ? ? 0.
Следовательно, для того, чтобы агент выбрал действие x ? A,
стимулирование со стороны центра за выбор этого действия долж-
но быть равно
(10) ?(x) = c(x) + U + ?.
Легко видеть, что, если в противном случае (то есть при выбо-
ре агентом другого действия) вознаграждение равно нулю, то
выполнены как условия согласованности стимулирования, так и
условие индивидуальной рациональности агента. При этом стиму-
лирование со стороны центра является минимально возможным.
Следовательно, доказано, что параметрическим (с параметром
x ? A) решением задачи стимулирования (5) является следующая
система стимулирования
? c( x) + U + ? , y = x
(11) ?QK(x, y) = ? ,
y?x
?0,
которая называется квазикомпенсаторной (QK-типа).
В случае, если на максимальную величину вознаграждения
наложено ограничение С ? 0, которое можно рассматривать как
размер фонда заработной платы (ФЗП), то из (10) следует, что
область компромисса (9) имеет вид:
S = {x ? A | H(x) – C – U ? 0}.
Рассмотрим теперь, какое действие следует реализовывать
центру, то есть каково оптимальное значение x ? A.
Так как в силу (10)-(11) стимулирование равно затратам аген-
та, то оптимальным реализуемым действием y* является дейст-
вие, максимизирующее в области компромисса разность между
доходом центра и затратами агента. Следовательно, оптималь-
ное реализуемое действие может быть найдено из решения сле-
дующей стандартной оптимизационной задачи
(12) y* = arg max {H(x) – c(x)},
x?S


1
С точки зрения формальной модели стимулирования достаточно, чтобы
материальное стимулирование со стороны центра компенсировало затраты
агента. Мотивирующая надбавка ? ? 0 может отражать мотивационные
(психологические и др.) аспекты управления.
23
которая получила название задачи оптимального согласованного
планирования [1, 12]. Действительно, то действие, которое центр
собирается побуждать выбирать агента, может интерпретироваться
как план – желательное с точки зрения центра действие агента. В
силу принципа компенсации затрат план является согласованным,
значит центру в силу (11) остается найти оптимальный согласо-
ванный план.
Условие оптимальности в рассматриваемой модели (в предпо-
ложении дифференцируемости функций дохода и затрат, а также
вогнутости функции дохода центра и выпуклости функции затрат
dH ( y * ) dc( y * ) dH ( y )
агента) имеет вид: . Величина в экономике
=
dy dy dy
называется предельной производительностью агента (MRP), а
dc( y * )
величина – его предельными затратами (MC). Условие
dy
оптимума (MRP = MC) – определяет так называемую эффектив-
ную заработную плату.
Отметим еще одну важную содержательную интерпретацию
условия (11). Оптимальный план y* максимизирует разность между
доходом центра и затратами агента, то есть доставляет максимум
суммы целевых функций (1) и (2) участников ОС, и, следователь-
но, является эффективным по Парето1.
Отметим, что квазикомпенсаторная система стимулирования
не является единственной оптимальной системой стимулирования
– легко показать, что в рамках гипотезы благожелательности ре-
(
шением задачи (5) является любая система стимулирования ? (?),
(
удовлетворяющая следующему условию: ? (y*) = c(y*) + U ,
(
? y ? y* ? (y) ? c(y) – см. рисунок 5, на котором приведены эскизы
трех оптимальных систем стимулирования – ? 1 , ? 2 и ? 3 .
*
* *




1
Напомним, что альтернатива называется эффективной по Парето, если не
существует другой альтернативы, обеспечивающей всем участникам ОС не
меньшие выигрыши, и хотя бы одному участнику – строго больший выигрыш.
24
c(y) + U

?1
*




?2
*
U
?3
*
y
*
0 y

Рис. 5. Оптимальные
системы стимулирования


Область компромисса является чрезвычайно важным поняти-
ем. Ее непустота отражает наличие возможности согласования
интересов центра и агента в существующих условиях. Поясним
последнее утверждение.
В формальной модели стратегии участников ограничены соот-
ветствующими допустимыми множествами. Учет ограничений
индивидуальной рациональности агента (условно можно считать,
что параметр резервной зарплаты U , фигурирующий в условии
участия, отражает ограничения рынка труда – см. введение) и
центра (условно можно считать, что неотрицательность целевой
функции центра отражает ограничения финансовой эффективности
деятельности центра – затраты на стимулирование агента не долж-
ны превышать доход от результатов его деятельности), а также
условий согласования, приводит к тому, что множество «рацио-
нальных» стратегий – область компромисса – оказывается доста-
точно узкой.
Фактически, компромисс между центром и агентом заключа-
ется в дележе полезности, равной разности полезностей в точках А
и В на рисунке 4. Делая первый ход (предлагая контракт), центр
«забирает» эту разность себе, вынуждая агента согласиться с ре-
зервным значением полезности. Легко проверить, что в противо-
25
положной ситуации, когда первый ход делает агент, предлагая
контракт центру, нулевую полезность получает центр, а агент
«забирает» разность полезностей между точками А и В себе.
Точки А и В на рисунке 4 являются «предельными» случаями,
в которых вся «прибыль» ? = H(y*) – C(y*) – U достается, соответ-
ственно, либо агенту, либо центру. Значительный интерес пред-
ставляют промежуточные случаи, в которых величина ? делится
между центром и агентом в соответствии с некоторым правилом,
взаимная договоренность о котором является компромиссом и
достигается в результате переговоров [7, 15]. Примерами подобных
правил являются: равное распределение (при котором центр и
агент получают по ?/2), принцип равных рентабельностей:
[H(y*) – ?(y*)] / ?(y*) = [?(y*) – c(y*)] / c(y*),
при котором размер вознаграждения является средним геометриче-
ским между доходом центра и затратами агента, и др.
Из проведенного анализа следует, что решение задачи стиму-
лирования может быть разделено на два этапа. На первом этапе
решается задача согласования – определяется множество (3) реали-
зуемых при заданных ограничениях действий. На втором этапе
решается задача оптимального согласованного планирования (12) –
ищется реализуемое действие, которое наиболее предпочтительно
с точки зрения центра. Подобная идеология разбиения решения
задачи управления ОС на этапы используется и в теории активных
систем, и в теории контрактов при решении широкого класса
задач.
Существенным «плюсом» квазикомпенсаторных систем сти-
мулирования является их простота и высокая эффективность,
существенным «минусом» – абсолютная неустойчивость относи-
тельно возможных возмущений параметров модели [2]. Действи-
тельно, если центр неточно знает функцию затрат агента, то сколь
угодно малая неточность может приводить к значительным изме-
нениям реализуемых действий. Вопросы адекватности моделей
стимулирования, устойчивости оптимальных решений и т.д. под-
робно исследовались в [2, 3]. Предложенная в упомянутых работах
техника анализа и методы повышения гарантированной (в рамках
имеющейся у центра информации) эффективности стимулирования
могут быть непосредственно использованы и для моделей, рас-
26
сматриваемых ниже, поэтому проблемы адекватности и устойчи-
вости в настоящей работе не рассматриваются.
Выше описан подход к решению задачи стимулирования, ис-
пользующий анализ свойств множеств реализуемых действий:
определялось множество действий, реализуемых некоторой систе-
мой стимулирования, после чего вычислялся максимум целевой
функции центра по этому множеству, а затем уже выбиралась
система стимулирования. При этом задача стимулирования распа-
дается на два этапа: этап согласования и этап согласованного
планирования. В явном виде эту последовательность можно выра-
зить следующим образом: на первом этапе для каждой допустимой
системы стимулирования вычисляются множества реализуемых
действий, затем берется их объединение: PM = U P (? ) , после
? ?M
чего на втором этапе решается задача планирования – максимиза-
ции целевой функции центра на множестве PM (отметим, что с
точки зрения модели компромисса PM = S).
Умея решать прямую задачу стимулирования, достаточно про-
сто найти и решение соответствующей обратной задачи. Напри-
мер, выражение (9) позволяет определить минимальные ограниче-
ния на стимулирование, позволяющие реализовывать заданные
действия. Взаимосвязь прямых и обратных задач стимулирования
подробно обсуждались в монографии [11]. Поэтому в настоящей
работе в основном ограничимся прямыми задачами стимулирова-
ния, наиболее близкими к задачам управления персоналом и т.д.
Интересно подчеркнуть, что выше оптимальное решение, фак-
тически, угадано без решения задачи «в лоб»1. Существенную
помощь при этом оказала идея введения множеств реализуемых



1
Следует признать, что для теории активных систем во многих случаях харак-
терно именно угадывание решений (исходя из интуиции, содержательных рас-
суждений и т.д.), а также стремление получить аналитическое решение. Объяс-
нения этому достаточно прозрачны: исследование формальной модели
социально-экономической системы не является самоцелью специалиста по
управлению – его задача заключается в том, чтобы предложить максимально
адекватное действительности содержательно интерпретируемое решение
задачи управления.
27
действий. Альтернативным подходом является анализ минималь-
ных затрат на стимулирование1.
Минимальными затратами (центра) на стимулирование по
реализации действия y ? PM в классе допустимых систем стимули-
рования M называется следующая величина:
(13) ? min ( y ) = min {?(y) | y ? P(?)},
? ?M
то есть минимальное допустимое вознаграждение, которое побу-
дит агента выбрать заданное действие. Для тех действий, которые
не могут быть реализованы в классе M, положим минимальные
затраты на стимулирование равными бесконечности:
(14) ? min ( y ) =+?, y ? A \ PM.
Если одно и то же действие может быть реализовано несколь-
кими системами стимулирования, то, очевидно, что в рамках ути-
литарной модели большей эффективностью обладает та из них,
которая характеризуется меньшими затратами на стимулирование.
Другими словами, оптимальным является класс систем стимулиро-
вания, реализующий любое действие агента с минимальными
затратами центра на стимулирование. Например, в рамках введен-
ных предположений принцип компенсации затрат можно сформу-
лировать следующим образом: ? y ? PM ? min ( y ) = с(y) + U .
Как следует из сказанного выше, в рамках введенных предпо-
ложений квазикомпенсаторная система стимулирования (11) явля-
ется оптимальным решением базовой задачи стимулирования.
Казалось бы, что можно еще «вытянуть» из этой задачи? Все дело
в том, что считалось, что квазикомпенсаторная система является
допустимой. Однако, на практике это не всегда так – центр может
быть жестко ограничен некоторым фиксированным классом сис-
тем стимулирования, причем эти ограничения могут быть как
экзогенными – например, определяться правовыми нормами, регу-
лирующими оплату труда, так и эндогенными – по тем или иным
причинам центр может быть склонен к использованию, например,
сдельной или повременной оплаты, а не к простой компенсации

1
Следует сделать следующее терминологическое замечание. Понятие «затра-
ты» характеризуют затраты агента по выбору того или иного действия,
понятие же «затраты на стимулирование» характеризуют затраты центра на
стимулирование по реализации того или иного действия.
28
затрат. Следовательно, необходимо оценить сравнительную эф-
фективность различных систем стимулирования.
Приводимое ниже описание систем стимулирования выполне-
но в рамках следующего общего подхода: для фиксированного
класса систем стимулирования определяются минимальные затра-
ты на стимулирование, затем сравниваются затраты на стимулиро-
вание для различных классов. Априори можно сказать, что так как
«идеалом» являются «абсолютно оптимальные» квазикомпенса-
торные системы стимулирования, то эффективность любой систе-
мы стимулирования будет не выше (а затраты на стимулирование,
соответственно, не ниже), чем квазикомпенсаторной. Однако,
важно не только качественное соотношение эффективностей, так
как ключевым является вопрос именно о количественных потерях
в эффективности (приросте в минимальных суммарных затратах на
стимулирование) – только зная величину этих потерь управляю-
щий орган может принимать решение о целесообразности исполь-
зования конкретной системы стимулирования. Основным инстру-
ментом оценки потерь в эффективности являются приведенные
выше результаты о соотношении эффективности и минимальных
затрат на стимулирование, поэтому достаточным оказывается
вычисление разности или отношения показателей эффективности
или соответствующих затрат на стимулирование.
Закончив вводную часть, в которой с точки зрения теории ак-
тивных систем и теории иерархических игр обсуждается инстру-
ментарий для дальнейшего исследования, перейдем к описанию
задачи стимулирования с точки зрения теории контрактов.


3. МОДЕЛЬ ТЕОРИИ КОНТРАКТОВ

Теория контрактов – раздел теории управления социально-
экономическими системами, изучающий теоретико-игровые моде-
ли взаимодействия управляющего органа – центра – и управляемо-
го субъекта – агента, функционирующих в условиях внешней
(возникающей извне по отношению к рассматриваемой ОС) веро-
ятностной неопределенности [11, 19].
Учет неопределенности в моделях теории контрактов произ-
водится следующим образом: результат деятельности агента
29
z ? A0 является случайной величиной, значение которой зависит
как от действий агента y ? A, так и от внешнего неопределенного
параметра – состояния природы ? ? ?, отражающее внешние
условия деятельности агента.
Информированность участников ОС следующая: на момент
принятия решений и центр, и агент знают распределение вероятно-
стей состояния природы p(?), или условное распределение резуль-
тата деятельности p(z, y). Действия агента не наблюдаются цен-
тром, которому становится известным лишь результат
деятельности. Агент может либо знать состояние природы на
момент выбора своего действия (случай асимметричной информи-
рованности), либо знать только его распределение (случай сим-
метричной информированности, более соответствующий моделям
стимулирования и поэтому в основном рассматриваемый ниже).
Стратегией центра является выбор функции ?(?) от результата
деятельности агента, которая в зависимости от содержательных
трактовок модели может интерпретироваться как функция стиму-
лирования (трудовые контракты), величина страхового возмеще-
ния (страховые контракты), величина задолженности или выплат
(долговые контракты) и т.д. Стратегией агента является выбор
действия при известной стратегии центра. Под контрактом, как и в
предыдущем разделе, понимается совокупность стратегий центра и
агента. При этом различают как явные контракты, то есть зафикси-
рованные с юридической точки зрения (большинство страховых и
долговых контрактов являются явными), так и неявные, то есть не
заключаемые формально или подразумеваемые (в ряде случаев
трудовые контракты являются неявными).
Так как результат деятельности агента, значение которого оп-
ределяет полезности участников ОС, зависит от неопределенных
параметров, то будем считать, что при принятии решений они
усредняют свои полезности по известному распределению вероят-
ностей и выбирают стратегии, максимизирующие ожидаемую
полезность.
Оптимальным является контракт, который наиболее выгоден
для центра (максимизирует его целевую функцию), при условии,
что агенту взаимодействие с центром также выгодно. Последнее
означает, что с точки зрения агента, как и в рассмотренной в раз-
30
деле 2 модели, одновременно должны выполняться два условия –
условие участия и условие индивидуальной рациональности.
Исторически первые работы по теории контрактов (см. ссылки
в [8]) появились в начале 70-х годов как попытка объяснения в
результате анализа теоретико-игровых моделей наблюдаемого
противоречия между результатами макроэкономических теорий и
фактическими данными по безработице и инфляции в развитых
странах.
Одно из «противоречий» заключалось в следующем. Сущест-
вуют три «типа» заработной платы: рыночная заработная плата
(«средняя» резервная полезность, на которую может рассчитывать
данный агент), эффективная заработная плата (та заработная плата,
которая максимизирует эффективность деятельности агента с
точки зрения предприятия1) и фактическая заработная плата (та
зарплата, которую получает агент). Статистические данные свиде-
тельствовали, что фактическая зарплата не равна эффективной
заработной плате (этот и подобные выводы делались исходя из
анализа данных по уровню безработицы и уровню инфляции).
В первых моделях по теории контрактов рассматривались за-
дачи определения оптимального числа нанимаемых агентов при
учете только ограничения участия и фиксированных стратегиях
центра, затем появились работы, посвященные методам решения
задач управления (задач синтеза оптимальных контрактов), сфор-
мулированных с учетом и условия участия, и условия согласован-
ности, затем акцент сместился на изучение более сложных моде-
лей, описывающих многоэлементные и динамические модели,
возможность перезаключения контрактов и т.д.
С точки зрения эффектов страхования (перераспределения
риска) интересен следующий сделанный в теории контрактов
вывод: различие между эффективной и фактической зарплатой
качественно может быть объяснено тем, что нейтральный к риску
центр страхует несклонных к риску агентов от изменений величи-
ны заработной платы в зависимости от состояния природы: ста-
бильность заработной платы обеспечивается за счет того, что в

1
В большинстве случаев эффективная заработная плата определяется из
условия равенства предельного продукта, производимого агентом, и предельных
затрат этого агента
31
благоприятных1 ситуациях величина вознаграждения меньше
эффективной заработной платы, зато в неблагоприятных ситуациях
она выше той, которая могла бы быть без учета перераспределения
риска2. Приведем пример, иллюстрирующий это утверждение.
Пример 3. Пусть у агента имеются два допустимых действия:
1? p
p
, ? < p ? 1. Содержа-
A = {y1; y2}, A0 = {z1; z2}, P =
1? p p
тельно, результат деятельности агента в большинстве случаев (так
как p > ?) «совпадает» с соответствующим действием.
Обозначим затраты агента по выбору первого и второго дейст-
вия c1 и c2 соответственно, c2 ? c1; ожидаемый доход центра (сти-
мулирование) от выбора первого и второго действия – H1 и H2 (?1 и
?2) соответственно; целевую функцию центра, представляющую
собой разность между доходом и стимулированием – ?, целевую
функцию агента, представляющую собой разность между стиму-
лированием и затратами – f.
Задача центра заключается в назначении системы стимулиро-
вания, которая максимизировала бы ожидаемое значение его целе-
вой функции3 E? при условии, что выбираемое агентом действие
максимизирует ожидаемое значение Ef его собственной целевой
функции.
Допустим, что агент нейтрален к риску (то есть его функция
полезности, отражающая отношение к риску, линейна), и рассмот-
рим какую систему стимулирования центр должен использовать,
чтобы побудить агента выбрать действие y1. В предположении
равенства нулю резервной полезности задача поиска минимальной
системы стимулирования, реализующей действие y1, имеет вид

1
На деятельность предприятий и, следовательно, на величину заработной
платы, оказывают влияние как внешние макропараметры (сезонные колебания,
периоды экономического спада и подъема, мировые цены и т.д.), так и такие
параметры как состояние здоровья работника и др.
2
Быть может, именно важностью этого вывода обусловлено то, что в работах
по теории контрактов рассматриваются практически только модели с внешней
вероятностной неопределенностью (в детерминированном случае, или в случае
неопределенности при нейтральном к риску агенте, эффекты страхования,
естественно, пропадают и фактическая заработная плата равна эффективной).
3
Символ «E» обозначает оператор математического ожидания.
32
(первое ограничение является ограничением согласованности
стимулирования, второе – ограничением индивидуальной рацио-
нальности агента):
(15) p ?1 + (1 – p) ?2 > min
? 1 ? 0, ? 2 ? 0

(16) p ?1 + (1 – p) ?2 – c1 ? p ?2 + (1 – p) ?1 – c2
(17) p ?1 + (1 – p) ?2 – c1 ? 0.
Задача (15)-(17) является задачей линейного программирова-
ния.
Множество значений стимулирования, удовлетворяющих ус-
ловиям (16) и (17), заштриховано на рисунке 6, его подмножество,
на котором достигается минимум выражения (15), выделено жир-
ной линией (линия уровня функции (15), отмеченная на рисунке 6
пунктирной линией, имеет тот же наклон, что и отрезок1 А1B1). Для
определенности в качестве решения выберем из отрезка B1C1 точку
С1, характеризуемую следующими значениями:
(18) ?1 = [p c1 – (1 – p) c2] / (2p – 1),
(19) ?2 = [p c2 – (1 – p) c1] / (2p – 1).
?2
A1
с1 /(1-p)



C1
(c2 - с1)/(2p-1)

?1
B1
0 с1 /p
Рис. 6. Реализация центром действия y1
при нейтральном к риску агенте

1
Отметим, что наличие множества решений при нейтральных к риску центре и
агенте является характерной чертой задач теории контрактов. В то же время,
введение строго вогнутой функции полезности агента (отражающей его не-
склонность к риску) приводит к единственности решения.
33
Легко проверить, что ожидаемые затраты центра на стимули-
рование E?(y1) по реализации действия y1 равны c1, то есть
(20) E?(y1) = с1.
Предположим теперь, что центр хочет реализовать действие
y2. Решая задачу, аналогичную (15)-(17), получаем (см. точку С2 на
рисунке 7):
(21) ?1 = [p c1 – (1 – p) c2] / (2p – 1),
(22) ?2 = [p c2 – (1 – p) c1] / (2p – 1),
(23) E?(y2) = с2.
На втором шаге центр выбирает, какое из допустимых дейст-
вий ему выгоднее реализовать, то есть какое действие максимизи-
рует разность между доходом и ожидаемыми затратами центра на
стимулирование по его реализации. Таким образом, ожидаемое
значение целевой функции центра при заключении оптимального
контракта равно ?* = max {H1 – c1, H2 – c2}.

?2
A2
с2 /p




C2
(c2 - с1)/(2p-1)

?1
B2
0 с2 /(1-p)

Рис. 7. Реализация центром действия y2
при нейтральном к риску агенте

Исследуем теперь эффекты страхования в рассматриваемой
модели. Пусть агент не склонен к риску, то есть оценивает неопре-
деленные величины в соответствии со строго возрастающей строго
вогнутой функцией полезности u(?). Так как от случайной величи-
34
ны – результата деятельности агента – зависит его вознаграждение
(значение функции стимулирования), то предположим, что целевая
функция агента имеет вид:
(24) f(?(?), z, y) = u(?(z)) – c(y).
Обозначим1 v1 = u(?1), v2 = u(?2), u-1(?) – функция, обратная к
функции полезности агента, и предположим, что функция полезно-
сти неотрицательна и в нуле равна нулю. Пусть центр заинтересо-
ван в побуждении агента к выбору действия y1. Задача стимулиро-
вания в рассматриваемой модели примет вид (первое ограничение
является ограничением согласованности стимулирования, второе –
ограничением индивидуальной рациональности агента):
(25) p u-1(v1) + (1 – p) u-1(v2) > min
v1 ? 0 , v 2 ? 0

(26) p v1 + (1 – p) v2 – c1 ? p v2 + (1 – p) v1 – c2
(27) p v1 + (1 – p) v2 – c1 ? 0.
Заметим, что линейные неравенства (26)-(27) совпадают с не-
равенствами (16)-(17) с точностью до переобозначения перемен-
ных. На рисунке 8 заштрихована область допустимых значений
переменных v1 и v2. Линия уровня функции (25) (которая является
выпуклой в силу вогнутости функции полезности агента) обозна-
чена пунктиром.
В случае строго вогнутой функции полезности агента (при
этом, очевидно, целевая функция (25) строго выпукла) внутреннее
решение задачи условной оптимизации (25)-(27) единственно и
имеет следующий вид (в качестве примера возьмем функцию
полезности u(t) = ? ln(1 + ? t), где ? и ? – положительные констан-
ты):
(28) v1 = c1 + (c1 – c2) (1 – p) / (2p – 1),
(29) v2 = c1 + (c2 – c1) p / (2p – 1).
Легко проверить, что в рассматриваемом случае при использо-
вании системы стимулирования (28)-(29) ожидаемая полезность
агента от выплат со стороны центра равна затратам агента по
выбору первого действия, то есть
(30) Ev = c1.


1
Подобная замена переменных, позволяющая линеаризовать систему ограниче-
ний, используется в двушаговом методе решения задачи теории контрактов.
35
v2
A1
с1 /(1-p)



C1
(c2 - с1)/(2p-1)

v1
B1
0 с1 /p

Рис. 8. Реализация центром действия y1

Аналогично можно показать, что, если центр побуждает аген-
та выбирать второе действие, то ожидаемая полезность агента от
выплат со стороны центра в точности равна затратам агента по
выбору второго действия.
Из (28)-(29) видно, что в случае несклонного к риску агента,
побуждая его выбрать первое действие, центр «недоплачивает» в
случае реализации первого результата деятельности (v1 ? c1) и
«переплачивает» в случае реализации второго результата деятель-
ности (v2 ? c2), причем при предельном переходе к детерминиро-
ванному случаю1 (чему соответствует p > 1) имеет место: v1 > c1,
v 2 > c 2.




1
Отметим, что все модели с неопределенностью должны удовлетворять
принципу соответствия: при «стремлении» неопределенности к «нулю» (то есть
при предельном переходе к соответствующей детерминированной системе) все
результаты и оценки должны стремиться к соответствующим результатам и
оценкам, полученным для детерминированного случая. Например, выражения
(28)-(29) при p = 1 переходят в решения, оптимальные в детерминированном
случае.
36
v ua(?) un(?)
B
v2 D




E F
c1

v1 A C
?
0 ?1 E?a ?2
E?n
Рис. 9. Эффект страхования при реализация центром
действия y1


Графически эффект страхования в рассматриваемой модели
для случая реализации первого действия отражен на рисунке 9, на
котором изображены линейная (определенная с точностью до
аддитивной константы) функция полезности агента un(?) и его
строго вогнутая функция полезности ua(?). Так как отрезок AB
лежит выше и/или левее отрезка CD, а ожидаемая полезность
агента в обоих случаях равна c1, то при несклонности агента к
риску ожидаемые выплаты E?a меньше, чем ожидаемые выплаты
E?n, соответствующие нейтральному к риску агенту (см. точки E и
F на рисунке 9). •
Завершив рассмотрение примера, иллюстрирующего эффекты

стр. 1
(всего 5)

СОДЕРЖАНИЕ

>>