本文的关注对象是企业。
在理论领域,企业是由合约组织形成的,合约是不完全的,不完全的合约为企业运行带来很多不确定性,一些关注这一问题的企业理论,探讨了弥补合约不完全性的途径:例如关系合同理论,通过将“关系”引入合约来考察合约的运行;剩余控制权理论则试图通过明确剩余权利的归属,使得合约得以完全,等等。但是合约真的能由此变完全吗?
在现实领域,以雇佣合约为例,通过在FD公司长时间地参与观察,笔者发现,作为雇主的公司老板和作为受雇者的中高级管理层之间的互动经常不在合约约束范围内进行,双方处于一种长期讨价还价的非合作博弈状态中。我们认为,合约的达成是合作博弈实现均衡的表现,如果合约是完全的且履行合约是有效率的,合约的实施将是严格进行的,那么双方的行动依据合约就可以了,过程中不存在可以实现博弈的策略空间;但现实中所出现的大量非合作讨价还价博弈,它的存在说明存在可供博弈的公共领域,也就是说合约以外仍存在空间。尤其是对于由老板和中高级管理者形成的公司核心层,由于工作的性质,他们的行动边界是相对最模糊的,合约具有高度不完全的特征。
既然合约以外存在博弈空间,进而,合约是不完全的。那么,合约以外的互动博弈既然不按照合约的约束,是否存在另外的规则呢?本文要做的,是在一个限定的前提假设范围内,将企业中一些简单的基本事实进行归纳和提炼,运用博弈论为基本工具,探寻合约不完全条件下企业核心层之间的微观博弈机制。
本文用以印证理论的现实部分,依据的是笔者在FD公司实习期间所获得的调研素材。笔者于2002年至2003年通过兼职实习的方式,实际参与并近距离地观察公司运行,这种参与观察的方式,便利了对FD公司1发展历史与实际运行资料的获取,但本文跳过了众多的资料,希望对文章关心的问题更多地给出理论分析。2
二、文献回顾和分析自“有限理性”和“交易成本”概念的提出,经济学对合约的研究就进入了一个新的平台,即承认合约是不完全的。威廉姆森(1985a/2000)对合约不完全的形成原因进行了分析:1,预测未来的困难,几乎无人能预测的未来状况成为合约不完全的主要原因;2,即使可以知道未来的情况,也不能完整地用语言表述出来;3,能表述出来的问题,也不能完全准确地测量并被第三方所接受。当然,这些仅是造成文本合约不完全的原因。
除了文本性明确规定的合约以外,还有一块是没有形成文字但雇佣双方谈妥或默认的部分。在企业雇佣关系中,这种情况经常发生在双方存在约前关系的事例中。这块可以称为默认契约。默认契约可以看作是双方认同的但没有进行第三方认证的合约,因为没有明确的可供监督的处理方法,对于原先默认的内容,双方任何一方都可随时推翻,所以即使有默认契约还是需要事后解释权(事实上,即便是明确契约,解释权也要有所归属,因为存在着理解能力、立场等方面的区别)。
如果我们假设签约双方的信誉度足以使得默认契约同正式契约具有同样的效力,那么另外的问题是:对于正式契约——合同来讲,行动在什么限度内规定为履行合同,什么又是不履行合同呢?现实当中,对于正式合约的实施空间也是非常大的。比如员工和老板签订合约以后,员工在一次合约履行过程中没有完全实现合约要求,老板对此行为妥协让步——这实际上默许了员工对原先合约的变更,是对原先合约的一次修正或变更(员工以后的行为可以依照原合约行事,也可以依照变更的合约行事,员工的选择集合由此变大了);老板对此行为给予惩罚——这实际上捍卫了原先的合约规定,是一次履行合约的过程。自从初次合约缔结以后,员工在任何一次合约履行过程中,其行为的选择集除了合约规定的以外,还有只要不受到合约规定的惩罚所可能允许的一切行为。
由上述分析得出,造成合约不完全的原因大致有三类:
1、由于预测、表达以及第三方测量的局限性,即有限理性,导致正式合约的不完全;
2、除明确契约以外,默认契约的实施不完全;
3、初始合约明确以后,在长期合约履行过程中的不完全,等等。
针对合约不完全,经济学家给出了不同的解决思路,用以弥补合约不完全的部分。关系合同理论代表了其中一种思路。关系合同的特点是,由于签署合同各方的有限理性和交易成本的存在,使得合同遗留了缺口的问题,并且这种缺口无法通过合同法来弥补,而要依靠在一个关系体系中的连续的协商来解决(Furubotn and Richter, 1998)。麦克内尔(1998)首先提出这一概念;而后威廉姆森将描述交易的三重维度(资产专用性、不确定性和交易频率),结合着麦克内尔对合同类型的区分(古典型、新古典型和关系型),一起纳入了治理结构的理论框架(威廉姆森,1985a/2000)。不过到此为止,关系合同仍然只是一个概念,在威廉姆森那里,无论是双边还是一体化治理,只关注了关系的重要性,但关系如何发挥作用来弥补合同不完全的缺口,没有给出进一步分析。刘世定教授(1999)在威廉姆森的理论基础上,通过对关系属性的进一步分析探讨了关系结构与治理结构之间可能存在的结构性摩擦,实际上揭示了关系合同内部仍然存在的不确定性。由此可见,关系合同只是一个粗略的框架,现实合同运行过程中可能存在的丰富多样的调试机制,还没有一一揭示出来。
针对合约不完全的另一种思路是以哈特(1998)为代表的剩余控制权理论。与上述不同的是,哈特主要讨论合同不完全条件下企业的治理机制,并且最初他关注的是在企业间合并或租赁的选择中,控制权的分配问题。他认为,由于合同不完全,从而企业中权力和控制的配置就变得十分重要。哈特讨论了剩余控制权的分配依据,并隐含地假定,通过明确剩余控制权的归属,合同不完全的部分将得到弥补。从某种角度讲,对于合同不完全部分的弥补,剩余控制权理论提出了较关系合同理论更为明确的一种解决机制,通过权利转让使得合约不完全的部分被解决掉了。但是,剩余控制权的分配是否真的能弥补合约不完全的部分呢?
哈特的观点分为三个逻辑段落:1、企业中人们无法拟定完全合同,所以剩余的权力和控制的配置就非常重要;2、企业中人力资产只存在激励不存在控制(人力资本属于个人),所以他不去讨论企业中人力资产的控制问题;33、那么企业的剩余控制权取决于对非人力资产的所有权。
这个简练过的逻辑链似乎能够对合同不完全下的企业剩余权力的控制进行了有效的分配,但我们仍然可以从中找出一些问题:
首先,对非人力资产的占有不是掌握剩余控制权的绝对标志。一方面,超出哈特的框架,这里“占有”的对象是一种实际发挥作用的权力,这种占有的标识物仅仅是“非人力资产”吗?4实际上在标识物与实际权力之间,缺失一个环节是“在权利分配中的谈判地位的增加”。可见,真正影响剩余控制权分配的是谈判地位的增加。另一方面,在哈特的框架内,如果承认非人力资产的占有标识物意义,在企业中对非人力资产的占有并非只有一个主体。
其次,企业的剩余控制权控制的是什么?哈特提到了剩余收入,5资产投资决策,人力资产等(哈特,1998:38、56、71)。前两项比较容易认同,但第三项“对于人力资产的控制”是值得质疑的,因为哈特也认为工人的人力资本属于个人。那么人力资本如何控制还要依赖于对企业内的人力资产与控制权的关系做出分析,而哈特的定义导致了他把分析重点放在了对财产的支配而忽略了对“行为”的支配上。
第三,企业内的人力资产与控制权究竟是什么关系?哈特对人力资产的讨论非常有限。他涉及到两个企业所有者人力资本的比较,涉及到对工人的激励,但是他不讨论企业内部的非所有者掌握控制权的情况。另外他还探讨了授权所造成的中间所有权形式,这事实上将代理人控制权的问题引了出来,但未作分析就煞了尾,因为这与哈特的主体理论是有冲突的。所以哈特仅提出了问题的一角,但没有深入探讨到企业内部人力资产对企业的控制权问题,虽然这个问题可能对哈特的整个理论具有修正或者颠覆的作用。
可见,这种从经济效率角度给出剩余控制权“应当”如何配置的分析,6其理论框架本身还存在很多缝隙。由于哈特的理论没有涉及对人力资产的充分关注,这种单方决定的剩余控制权的分配,根基是不坚实的,仅理论本身就存在众多问题。因而这种弥补合约不完全的解决思路,其实是一种一厢情愿的解决、虚假的解决。
对于合约不完全尤其是人力资本合约的问题,让我们重新回到巴泽尔的论述。巴泽尔(1997)曾从产权角度进行过一系列的分析。他的奴隶制研究阐释了人力资产作为“主动的财产”的特殊性(巴泽尔,1997:105~118)。周其仁(1996)进一步发展了“人力资本与人天然合一”的观点。
在巴泽尔和周其仁那里,可以说,界定产权是有成本的,所以在实际中将出现很多由于界定困难而出现的“公共领域”,那么此时,会出现激烈的攫取资源的行动;对于人力资产而言,由于它天然属于人本身,所以在使用、管理和让渡人力资产时,可能出现更多的冲突领域。其实,对公共领域的研究很有意思,尤为值得关注的是其中的实现机制是怎样的。巴泽尔通过一些简单的例子,例如排队配给、奴隶制等,向人们展现了用以解释公共领域实现配置的基本逻辑,但仍没有揭示配置过程的微观实现机制。
汪丁丁在给巴泽尔一书所写的序中,指出,“在巴泽尔的产权理论里,起着主要作用的是‘公共领域’(public domain)概念。而博弈论也许是描述公共领域里寻租者们行为及其结果的最好工具。”“……彻底的产权分析要求一种博弈论的眼光。而在博弈论眼光下,产权安排与资源配置是同时被博弈决定的,正好像寻租者们的博弈均衡不仅决定了资源在人们之间的配置,也同时界定了寻租者们对资源的不同权利。(巴泽尔,1997:4、9)”汪丁丁的设想与本文的意图刚好一致,对于由人来实现的对公共领域丰富多彩的资源配置过程,将博弈论作为分析工具,是一种与所分析问题契合度很好的尝试。本文将实践这种尝试。
三、基本模型框架——二人博弈本文研究的主题,希望通过对FD公司的核心管理层的调研,给出他们在合约不完全条件下(也就是权利界定的公共领域内)相互博弈的微观机制。
文章的主体部分将选取协调博弈模型作为主要分析工具,同时将现实情况抽象为博弈条件,引入模型当中,最终分析协调博弈的均衡结果的形式。针对文章的研究主题和分析工具,文章将采用个体主义方法论,并将“理性人”作为文章基本假设;我们的分析基于具有有限理性且含有机会主义行动倾向的个体行动者,探讨其在追求个人利益和实现企业(集体)利益的冲突和并行的过程中,相互之间形成的一种由地位影响的博弈机制。
确定模型框架,可以将作为雇主的企业所有者和作为受雇者的管理者(以下简称所有者和管理者,或老板和管理者)视作企业的两极,而分别由所有者和管理者完全控制剩余权力作为模型的两个极端状态,所有者控制是哈特理论的思路,而管理者控制则是管理者篡权的特殊情况。中间状态则是所有者和管理者势均力敌的情况,谁都可能有对剩余权力的解释和控制权。然而这种情况下有两种状态,一种是所有者和管理者都企图为掌握剩余控制权而进行争夺,此时可能进入一种力量的对峙状态;另外一种即双方都不去关注剩余控制权,此时剩余控制权则事实上不存在,成了多余的概念,这时对于企业中合同不完全部分的判定和解决方式,则没有别的规则可循,就相当于市场的自由交易状态。
将控制权的分配纳入博弈论中来考察,可以发现,在老板和管理者两种参与者之间,总是通过一个缓解针锋相对的协调博弈过程来实现一次控制权的分配,如表 1所示。
![]() |
表 1 控制权的分配 |
对于一次博弈,我们假设,无论是双方都企图控制的对峙状态,还是双方都不控制的放任自流状态,都将导致双方合作的失败,双方收益为(0,0)。而只有一方实现控制能够使得合作继续,此时表现为博弈实现均衡,均衡解有两个,分别为(1,2)和(2,1),7控制一方的收益将大于不控制一方的收益。而最终控制权如何分配,即博弈确定在哪个均衡解上,则需要引入其他条件,分析实现机制。而对于剩余控制的长期分配状态,则是由多个一次博弈逐渐演进而来的。
对以上几种状态的博弈表述,可以借用安德鲁·肖特(2003)的概率单纯形来实现。
假设老板与管理者为参与者i和j,老板i的一个可能的策略类型,即(老板控制,管理者也控制)以σi[αi1/αj1]来表示,Рi(σi[αi1/αj1])则表示老板这一可能策略的概率。那么老板i的概率单纯形如下图所示:
![]() |
按照肖特的界定,概率单纯形的四个角点A、B、C、D,代表着管理者j有这样一个信念,即老板i将以1的概率使用一个特定的超博弈策略,以0的概率使用其他所有策略。也就是说,这四点分别代表老板i四种策略的概率均为1的情况,换句话说,它们分别代表了表 1所示的四种博弈策略实现的情况,即A(老板控制,管理者不控制),B(老板控制,管理者控制),C(老板不控制,管理者不控制),D(老板不控制,管理者控制)。而四种情况下的收益则如表 1所示。
之所以这里引入概率单纯形来说明,有两个考虑:1、肖特研究制度的创生过程,他借用了约翰·海萨尼(Harsanyi,1975/2003)的“追踪过程”(Tracing procedure)的原理,用概率单纯形来模拟地演示了每一次博弈结果与最终形成的一个制度之间的关联。8对于本文研究每一次剩余控制的博弈对剩余控制分配状态的影响而言,这实际上为我们提供了一个关注长期博弈的演进过程的视角和框架。2、肖特所研究的制度,是从一种自然状态开始的,他假设了一个类似于无知之幕的自然原初状态,即位于概率单纯形ABCD的中心点的E点,从E点出发,每一次博弈将推动制度最终确定在一个均衡的角点上。而本文所关注的企业中雇佣双方之间的博弈演进过程,则不是从一种自然状态开始的,从某种程度上说,这个过程将从概率单纯形的一个角点出发而逐渐演变,这个点就是A点,即(老板控制,管理者不控制)的情况,因为这是管理者与老板雇佣合约签订之初的情况。然而,与肖特所探讨的制度从无到有的创建过程不同,本文则探讨了制度自我更新的一些微观机制。
此外,对于本文所研究的雇佣双方的博弈而言,在长时期内,要对两个行动者(老板i和管理者j)以及两组行动者(其中一组是固定的,即老板;一组是变动的,即管理者作为参与者是渐次进入的)的多次博弈,做分别讨论。其意义在于,对于一组参与者来说,组内是否具有传承机制对于博弈结果是有影响的。
四、原初状态与初期适应 (一) 对原初状态的界定 1. 签约带来的权力-地位关系前面提到,对于雇佣双方的博弈而言,原初状态可能是老板控制的情况。这涉及到企业内部的权力的问题。对于企业中是否存在权力,很多学者作出过分析(科斯,1937/2000;威廉姆森,1985b/2000;张五常,1983;阿尔钦和德姆塞茨,1972/2002等)。从企业形成的角度讲,权力是否是企业区别于其他组织形式的关键因素,成为学者讨论未果的一个问题。如果只是从企业作为要素市场的角度出发,关注要素合约双方的关系,是否存在权力配置呢?
爱默森和布劳提出来了影响“权力-依赖”关系的几个条件。如果A可以为B提供某种B极其想要的利益,并且A具有提供的资源;如果B可以在别处获得必要的服务,即有替代A的提供者;如果B能强迫A提供服务;如果B能学习在没有这种服务的情况下行事。这四个因素,可以影响A和B之间的“权力-依赖”关系(布劳,1988)。
签约前,对于进入者员工来讲,企业具有更多的资源、挑选员工的自由以及没有特定员工的情况下正常运行的能力,那么从利益需要、资源、替代性、失去后的承受力来讲,员工是依赖企业的,企业对员工具有更多的权力和更高的谈判地位。这里老板是企业的代表。其实,员工在应聘时(签约前)向企业展示自身具有的符合或超出企业需要的人力资本特征的行为,其隐含的意义是:如果企业认可这些人力资本特征并接收员工(签约),则企业可以支配和使用员工的这些人力资本特征,并可能由此获得收益。因此可以说,(至少)在签约前,员工是认可老板对自身人力资本的支配和使用权的。
员工进入企业,是以部分地转让自身的权利,承认老板的权威为前提的。因为这是进入企业的条件。
在签约时,根据合约平等自愿的原则,双方的谈判地位达到短暂的一致。
在签约后,一方面根据威廉姆森基本转换的说法,员工从外部的多人竞争,转变为在企业内部的少数人竞争,员工的竞争强度降低了,地位提高了,在谈判地位上相对于约前而言更强些。另一方面,员工与非人力资产的结合日益紧密,从企业那里获得的技能、经验、资历等人力资本均有提高,自身的绝对地位和价值增加;另外,在与老板互动过程中形成的“约后”关系,成为重新界定双方谈判地位的影响因素,在其影响下形成的实际履行的合约(或称合约的履行过程)与之前签订的文本合约具有或大或小的差别,并代替了文本合约实际发挥着作用。在合约退出成本上,从员工自身的角度上说约后较约前的退出成本增大,因为人力资本发生了一定的专用性转移,这部分的转化需要成本。但相对于单个员工而言,企业的整体退出成本更大:一方面,在合同期内解除劳动关系需要承担一定的成本,9另一方面,企业对员工支付的专用性培训、“干中学”的技能等等,都将随着合约的解除成为沉没成本。
2. 作为博弈结果的初始状态有些企业在雇佣合同中规定了剩余控制权的归属由老板拥有,这能够成为雇佣博弈的制度演进的起点;其实更为基本的原因是,管理者进入企业之时是以转让对自身人力资本的使用权为前提的,而使用哪些以及如何使用人力资本,是由企业老板决定的。可以说,老板占据了最初的博弈先占优势,并且这种先占是管理者也认可的,因为它可能也是一种博弈均衡的结果,如表 2所示。
![]() |
表 2 任务的布置 |
对于老板布置的一项工作,如果双方的意见不一样(——老板坚持任务应当完成,而管理者则认为不完成也可以,或者反之),那么则合作破裂,双方收益均为零,如果老板坚持了自己的意图,管理者妥协,博弈均衡解为(2,1),相反情况,即员工轻视或拖沓任务,老板也默认(现实存在的情况),则均衡解为(1,2)。那么对于现实中选取哪个均衡,“先说”的机制就具有决定性,即谁先提出来,就按照谁的意图办,对方只能妥协。10因为理性的个体如果不这样做,就会使合作破裂,则双方收益均为零。而对于刚刚进入企业的管理者来讲,这时是没有讨价还价余地的。表 2体现了这个博弈过程,老板“先说”提出“完成某任务”的要求,理性的管理者在自身两项选择“完成某任务”收益为1和“不完成也可以”收益为0中,只能选择“完成某任务”,取得1的收益,最终博弈均衡在(2,1)上。应当说,老板的先占优势是由地位和角色特征决定的,因为在任何一次任务的布置当中,由地位影响的“先说”机制主导着控制权的走向。这构成了雇佣博弈的一个初始状态。
(二) 初期的相互适应在大多数劳动力市场上,当雇主雇佣一个人时,对他的生产能力并没有把握。即使雇佣后,雇主也不是必然能马上知道新员工的生产能力。员工适应新工作可能要花一些时间,经常还需要接受具体培训。而且,在合同期内,也不允许重新制定合同。一段时间之后,雇主才能知道员工的生产能力,这一事实意味着雇佣是一种投资决策。由于事先不知道员工的生产能力,这种决策就处于不确定情况之下,未知的生产能力所带来的风险则由企业全部承担。从员工角度讲,对雇主和企业的特性也存在认识上的盲点,只能在逐渐地了解中验证或调整自己最初的判断。
所以在雇佣初期,博弈双方的共同知识有限,此时行动者出于机会主义考虑,存在着对自身信息的隐瞒和虚报的动力,双方往往进行着非完全信息的信号博弈。此时,双方都根据对方发送的信号来估计对方的类型,调整自身的行动,这是一个相互适应的过程。
1. 信号发送者—管理者先来考察管理者为信号发送者的情况。
一般来说,在雇佣一个人后,根据以前市场上的经验,假如有各种各样的信号和指标组合,雇主将会对员工的生产能力进行条件概率的评定。最终雇主会在某个事后得知他的生产能力。斯彭斯(1973/2002)的就业市场信号模型开创了信号博弈领域,他揭示了劳动力市场上企业把教育水平作为有关能力的一个信号,从而给受过更高教育的工人开出更高工资。模型中也涉及低能力的工人冒充高能力工人的可能,但他假设对低能力工人来讲要获得与高能力工人同等教育水平所花费的成本过高,并且可能即使获得高工资也不足以补偿这个成本,这样就使得教育水平成为能力的一个有效的甄别变量。但是,在能力评定过程中,还有很多关于信息披露方面的不对称:如果雇主和雇员本人在签约时都不知道雇员的能力,但雇员本人签约后发现了自己的能力,而雇主仍然不知道,则存在隐藏信息的道德风险问题;如果雇员一开始就知道自己的能力而雇主不知道,则存在逆向选择问题;如果雇员一开始就知道自己的能力并控制自己的能力信息传递到雇主那里,则存在信号传递问题;如果雇主知道雇员的能力但不知道其努力水平,则存在隐藏行动的道德风险问题,等等(张维迎,1998)。
从这个角度讲,雇佣关系在开始之前雇主要承担不确定性下的投资风险,在实现以后雇主仍要承担信息不对称的可能性,由此雇佣双方的信息优势似乎并不倾向于雇主一方。
在我们关注的企业——FD公司中,可以观察到一个现象,企业中很多重要职务(包括高级和中层管理人员)都是老板从熟人圈子中引进的。这些进入企业的人,原先有着各自的职业背景和经历,在原先的职位上都有过相对出色的业绩和资历表现,和老板之间也有着良好的人际交往关系。这些人原先的背景与FD公司的运作方式及所属的专门产业领域大多相差很远(多为机关出身或者从事其他产业),但进入FD之时即被赋予较高的职务和待遇,以及相应需要承担的职责。这是一种相对特殊的信号发送者,因为接受者对发送者所发送的信号具有较明显的偏好,这将影响接受者的行动。相应地,这种偏好对接受者而言,如果他所偏好的信号与实际的类型不符,则意味着接受者将承担更大的风险。
当管理者为发送者,老板为接受者时,博弈的时间顺序如下:
1) 自然根据特定的概率分布Р (ti),从可行的类型集T={t1, t2}中赋予管理者某种类型ti,这里对所有的i,Р (ti)>0,并且P(t1)+P(t2)=1;这里t1为胜任工作,t2为不胜任工作;
2) 管理者观测到ti,然后从可行的信号集M={m1,m2}中选择一个发送信号mj;这里m1为以往资历、业绩及与老板的关系,m2为努力工作;
3) 老板观测到mj,(但不能观测到ti),然后从可行的行动集A{a1,a2}中选择一个行动ak;这里a1为重用,a2为不重用;
4) 双方收益分别由U管理者(ti,mj,ak)和U老板(ti,mj,ak)给出。
管理者的一个纯战略是函数m(ti),明确管理者自己为哪一种自然赋予的类型时将选择的信号;老板的一个纯战略是a(mj),指明对管理者可能会发送的每一种信号将选择什么行动。在这个信号博弈中,管理者和老板都有四个纯战略。11
管理者战略1:如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2,选择信号m1;
管理者战略2:如果自然赋予类型t1,选择信号m1;如果自然赋予类型t2,选择信号m2;
管理者战略3:如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2,选择信号m1;
管理者战略4:如果自然赋予类型t1,选择信号m2;如果自然赋予类型t2,选择信号m2;
老板战略1:如果管理者选择信号m1,选择行动a1;如果管理者选择信号m2,选择行动a1;
老板战略2:如果管理者选择信号m1,选择行动a1;如果管理者选择信号m2,选择行动a2;
老板战略3:如果管理者选择信号m1,选择行动a2;如果管理者选择信号m2,选择行动a1;
老板战略4:如果管理者选择信号m1,选择行动a2;如果管理者选择信号m2,选择行动a2。
这一两类型、两信号博弈有四个可能的纯战略精炼贝叶斯均衡:1.混同于m1;2.混同于m2;3.分离,t1选择m1,t2选择m2;4.分离,t1选择m2,t2选择m1。图 1所示收益值的前提是,老板对具有一定资历的熟人有着选用的偏好。那么,如果管理者选择混同于m1,则老板的最优反映是a1;这时管理者的收益为2和2,老板为4和0,均优于其他三种可能的精炼贝叶斯均衡的解。所以管理者选择m1,即展现出先前的资历和业绩以及与老板的良好关系,是最优选择。但是,在管理者的类型分布为0.5和0.5的时候,老板则需要承担一半的风险,而管理者的收益则是稳定的。如果只考察雇佣博弈初期,作为接受者的老板还不能分辨出管理者是否能够胜任工作,所以也意识不到自身的风险,从这个角度讲,这样一些有着良好资历以及与老板关系密切的管理者,在进入企业之初所具有的优势,以及老板此时所承担的风险,是一种相对的事后评价。
![]() |
图 1 |
同样地,雇佣初期,作为管理者也同样注重通过鉴别老板发送的信号以了解老板的特性,因为这关系到管理者本身对企业的判断,以及对日后去留和发展等的预计。
下面考察老板作为信号发送者的情况。
博弈初期,管理者根据老板的“表现”来选择和调整自身的行动策略,这种初期的适应和调整可能影响长期的雇佣博弈。那么,当老板为信号发送者,管理者为接受者,相应的参数设置如下:
1) 自然根据特定的概率分布Р (ti),从可行的类型集T={t1, t2}中赋予老板某种类型ti,这里对所有的i,Р (ti)>0,并且P(t1)+P(t2)=1;这里t1为接纳程度高,好相处,t2为接纳程度低,不好相处;
2) 老板观测到ti,然后从可行的信号集M={m1,m2}中选择一个发送信号mj;这里m1为想法较多,强势控制,m2为表现一般,弱势放任;
3) 管理者观测到mj,(但不能观测到ti),然后从可行的行动集A{a1,a2}中选择一个行动ak;这里a1为积极参与建议,主动性高,a2为顺从听话,主动性低;
4) 双方收益分别由U老板(ti,mj,ak)和U管理者(ti,mj,ak)给出。
同样,老板和管理者在这个信号博弈中也都有四个纯战略,且有四个可能的纯战略精炼贝叶斯均衡:1.混同于m1;2.混同于m2;3.分离,t1选择m1,t2选择m2;4.分离,t1选择m2,t2选择m1。如图 2所示:
![]() |
图 2 |
图中各种情况下的赋值大致反映了一种定序的收益状况。根据FD公司的实际情况,不论老板是何类型,他持续反映出的信号是m1,即有许多想法、偏好强势控制的,那么可以说,实际上老板的表现是混同于m1,此时,不论管理者主动性高低,老板的收益几乎没有变化,而管理者的策略a2(收益为2和2),却是优于a1(收益为1和0)的。那么可以说,当老板表现为强势时,管理者的最优战略为顺从听话,主动性低。这种博弈结果对老板是相对有益的,因为如果暂不考虑任务完成情况,管理者服从老板的权威是老板占据控制权的前提,老板似乎可以由此继续占据优势地位。
五、长期讨价还价博弈 (一) 长期讨价还价的形成因素 1. 生存博弈与道德博弈的融合与冲突管理者以对企业的认可为前提,进入企业之初满怀对未来的期望,希望企业是个人长期实现价值的地方,预期是长期的;再加上与老板建立在良好交往背景下的融洽关系,使得管理者较容易将个人收益与企业的集体收益目标结合起来,预期达到双赢的目的。这看似极为融洽且一致的良好氛围,内部包含了两种效用取向:前者,即实现个人预期收益是生存意义上的效用;而后者,在良好关系基础上实现双赢,则包含道德层面上的效用。这一点是容易理解的,具有一定组织程度的人,在追求个人收益的效率原则(不论是最大化原则还是满意原则)指导下,同时将在长期产生出一些人际情感规则,这里借用肯·宾默尔的提法,称为生存博弈的规则和道德博弈的规则(宾默尔,2003)。宾默尔对这两种规则的关系有一些界定,“生存博弈的规则由自然来确定,无论我们相信与否它都存在。如果一个社会的成员具有经济人的自我利益动机,他们就会在生存博弈中通过协调达到均衡,我把这样一个均衡称为社会契约,因而一个社会契约是对每一个人的战略均衡的剖面图。在社会契约起作用的时候,每一个根据他的战略规定的行为规则行动的成员都会达到最优状态,但是维持均衡的这些规则并不受生存博弈规则的制约,它们完全是出于习惯。它们之所以存在只是我们信仰它们,如果社会演化的偶然事件把社会导向了另一个不同的均衡,我们可能会信仰另一套习惯规则。(宾默尔, 2003, p403)”这里的习惯规则,也就是宾默尔界定的道德博弈规则。宾默尔认为,生存博弈是具有自利动机的人所广泛进行的那一类博弈,而如何在生存博弈中达到均衡,往往要借助道德博弈来完成,实际上就是借助在一个人类群体中所信仰或认同的人际规则。
区分这两种规则以及两个博弈过程,对考察长期内人们之间的互动博弈是有指导意义的。可以说,我们所研究的FD公司中,在雇佣双方的雇佣关系形成之初就存在一定的正向的人际交往关系(这得益于约前关系的存在),因此道德博弈此时是存在基础的,并且能够引导生存博弈的均衡的产生方向。这与宾默尔所指的生存博弈基础上的道德博弈略有不同,但仍然遵循两者之间的结合关系。宾默尔将引入道德博弈后的均衡博弈均衡结果称为公平博弈的结果,“一项公平的契约不过是一个生存博弈的均衡,条件是如果道德博弈中使用这一均衡的战略而不会对道德博弈的参与人产生求助于原初状态装置的激励。一项公平的社会契约均衡因而也成了道德博弈的均衡,但绝对不能忘记的是,它还必须是生存博弈的均衡——否则,它将不具有可行性。事实上,道德博弈只不过是一个在生存博弈中进行均衡选择的协调装置。(宾默尔, 2003, p55)”在宾默尔的理论中,生存博弈和道德博弈有着各自发生作用的范围,基本上是前者先于后者;而现实中则可能有着更多的实现机制,例如由后者来界定或影响前者,或者是某一种博弈规则在一定时期内占据主要地位,而另一种博弈规则的引入则成为冲突发生的原因。
2. 权威的认同有些学者认为,雇主和雇员之间的关系是一种不对称的带有权威的契约,就是因为企业有明确的剩余权利所有者——雇主。这显然是因循了哈特的剩余控制权理论,我们已经指出了他的问题所在。从另一角度讲,不是因为剩余控制权既定,所以权威既定,而是某一方由于拥有权威,从而拥有博弈的优势地位。
对于企业内权威的实现,“巴纳德坚持认为,与其说权威是自上而下的,还不如说权威取决于下属的接受或者同意。命令常常得不到遵守”(威廉姆森,2001:16)。在员工进入企业之时接受的老板对员工自身人力资本的支配和使用权,在进入后的过程中需要重新得到员工的认同,即合法性检验。这时,员工具有了一个评判的权利,在企业中所有的员工评委面前,老板的权威需要得到检验,这种认同过程本身就调整了被检验者与评委之间的地位。所以可能导致最初接受的或默认的权威在过程中受到置疑甚至挑战,需要重新认定。这一过程通过调整原初状态的相对地位,而使得长期内出现了由博弈地位的不同而导致的不同的博弈均衡,换句话说,权威的认同过程也是双方在长期内不断讨价还价的博弈过程。
3. 专用性机会主义的引入人们带着人力资本进入企业后,人力资本会因为针对性的培训、对岗位的熟悉和适应(包括技能、文化等的传承)、工作经验的积累以及和他人合作等过程发生变化。也就是说,人力资本在与企业中的一些非人力资产(也包括其他人力资产)的结合互动过程中,增长了特殊的部分,其中包括针对知识技能的专用性成份,还包括思想意识方面的适应性、变通性12成份。对于专用性人力资本,一种观点认为,资产专用性会致使拥有这一资产的一方“套牢”,从而降低了具有专用性人力资本的一方的谈判地位(威廉姆森,1979/1988);但另一方面,也可能因为企业需要或依赖某种专用性人力资本而使得拥有它的一方获得较高的谈判地位。
许多学者都认为,专门知识的在企业中具有重要作用,专用性是企业中权力配置的一个重要因素(Meckling & Jensen, 1976/2000;Doeringer and Piore, 1971/2000;Hayek,1945/2000)。由此,拥有专用性知识的受雇者群体,谈判地位逐渐提升,甚至达到挑战雇佣者的程度,那么我们可以说,专用性知识在长期内影响着雇佣双方的博弈结果。
企业中一个常见的过程是:人力资产被雇佣后,逐渐从缺乏具体经验的外部人达到与内部人相同的水平。贝克尔(1962/2000)在分析专用性人力资本问题时忽视了机会主义讨价还价的困难。他最初假定,如果雇员进行专用性投资,企业就会欺诈雇员。但他没有考虑到反向欺诈的复杂性。机会主义还表明,当企业进行了专用性投资后,雇员就会以辞职相威胁,除非企业增加工资。13
总之,在我们的研究对象——管理者——进入企业之后,原初状态的地位分布将随着上述一系列的因素而发生调整。由此,双方的博弈进入一个新的阶段,长期讨价还价阶段。在这个连续的讨价还价博弈中,每个博弈终结时都引申出新的控制权分布,但都是动态的结点上的描述。那么可以说,从时间序列上看,契约永远不能完整描述,但在每个时点上,又都是相对分配完整的。
(二) 长期讨价还价博弈的实现机制 1. 管理者的策略转变对于以前没有接触过的行业、或者对于一种同行业中全新的思路,管理者接纳起来需要一定的成本付出,而且初期是一个付出大于收效的阶段。人力资本经济学认为,人的生产力水平不是如工资水平那样具有明显的涨落过程,而是相对较为平滑的曲线。那么,投入工作初期,管理者要经历一个具有较低收益和较高预期的付出过程,如图 3所示:
![]() |
图 3 |
这样一来,管理者对当期收益和预期收益的贴现值的加总,将成为他付出生产力的回报。那么,当工作的难度对管理者而言较大,他需要付出非常大的努力才能实现,或者即使如此都不能保证实现,而在回报组合中当期的现值又较低的情况下,管理者将对任务的态度和自身付出作出重新调整。这种自我调整实际上是一个自我博弈过程。接受工作初期,管理者由对老板的认可辐射至对工作任务的认可,此时管理者更加看重道德博弈规则,FD公司中几位高管人员就是这种心态:老板W和自己朋友多年,现在请自己过来一起做事,一定不能辜负朋友的心意,努力做好交代的任务;而且W本身思路颇多,在朋友圈子中一直受人尊重,他的项目一定是高质量的,值得好好做。在这种情况下,管理者承担了公司中的要职,对于开拓性、延展性的工作相对独自面对,就要承担较大的责任,付出较多的努力。当任务的实现出现困难时,管理者将会对任务本身产生疑问,这个任务是可行的吗?在这种情况多次发生后,管理者逐渐质疑老板的思路和想法,老板把任务想得很好但实现得了吗?当这种质疑替代了最初的那种心态,此时道德博弈的基础就松动了,管理者将为自己考虑自身在企业中的定位以及相关的收益,此时生存博弈的重要性地位将超过道德博弈,指导管理者接下来的行动。
在雇佣关系建立之初,一方面管理者尊重老板的地位,同时也由于任务的布置的主动权在老板一方,所以老板往往依据“先说”优势,在双方的协调博弈中获得一个占优的均衡解。而在任务的实际操作中,“先做”原则则占先了。因为任务被管理者领走以后,直接主体变成了管理者。
![]() |
表 3 任务的实施 |
管理者在任务实施过程中占据了“先做”原则,获得了协调博弈的均衡结果。这里管理者的“由于各种原因不完成”的策略导致的因素可能有很多,从任务角度考虑可能由于任务的难度较大,或者考核完成与否的标准较为复杂;从管理者角度考虑可能由于管理者的偷懒,或者管理者不认同任务等等。不管怎样,这是管理者的一个最优选择。而老板在这个过程中,首先他的行动是延迟的,他只能对管理者已经发生的行动采取反映;同时出于对这些管理者进一步为企业做出贡献的期望,为了保持管理者队伍的稳定(特别是高管人员),老板不会强行选择“加强监督”,使得合作破裂,从而实现了妥协,最终均衡在(由于各种原因不完成,不监督)上。在FD公司内部,很多时候W都和高管人员以及中层管理者实现任务完成上的“妥协”。这样一来,虽然在任务布置阶段W获得了强势的先机,但任务实施中则是由管理者占据了控制权,这体现了行动优于话语的控制权。
2. 老板的策略应对管理者如果想保持对自身有利的博弈结果,单靠“先做”机制是不够的。老板不会轻易将最初的优势地位拱手让给管理者,使得自己处于被动的反应地位。因此老板将向管理者施加压力,而在谈判博弈中一个最有效的压力手段是威胁。威胁是这样一个过程,它有以下一些要素:A通过让B相信,如果B不按A的要求去做,那么A将采取某种策略T,而达到威胁B的目的。假设A和B是理性个体,那么若B不照做,A就被迫要实施威胁T,这对威胁的成功非常重要。否则的话,威胁就毫无意义。因为一般而言,如果单独考虑威胁本身,那么A并不想实施。这个过程中,A即老板本身,B则是管理者。可以看出,老板在向管理者施加威胁的压力时,是通过两个阶段完成的,第一个阶段是威胁的提出,而第二个阶段则是威胁的实施。当然,就老板的策略而言,他只希望威胁的第一阶段起到作用,但博弈的开展将不完全按照老板的预期进行,那么第二阶段,即威胁的实施将有可能实现。
在分析之前,我们可以用正式的谈判模型(纳什,1950/2000:54)进行参照:
第一步,每一个参与人i选择一个混合策略ti,作为当两人不能达成协议,也就是说,当他们的要价不相容时,他不得不采取的策略。这一策略ti就是参与人i的威胁。
第二步,参与人互相通报自己的威胁。
第三步,在这一阶段,参与人独自行动,不进行沟通。每一位参与人确定自己的要价di,即他效用图上的一点。这里的意思是,除非合作方式能给他带来的效用不小于di,否则该参与人不会选择合作。
第四步,现在可以决定支付了。如果存在点(u1,u2)满足u1≥d1,u2≥d2,那么参与人i的支付就是di。也就是说,若参与人的要价能同时得到满足,那么每个人就得到他所要求的。否则的话,参与人i的支付就为pi(t1, t2),即一定实施威胁。
这里有一些对于考察雇佣双方博弈有意思的点。首先,对于双方可能有的威胁,在实施行动之前(也就是第三步之前)双方就已经清楚了,而且这种威胁有时是由双方的角色和地位决定的,有时不必通报也由双方默认。第二,参与人实施威胁的前提,是合作带来的效用ui不小于自己的要价di,但模型并没有对di进行更多的说明,那么di到底是最大化点、满意点还是作为底线的点呢?对此没有一定之规。可见,威胁的实施时机是由行动者自己控制的,这就给模型带来很多机动的成份。第三,威胁可以是双方均采取的,那么模型就较为复杂;也可以是单方的策略,比如在探讨老板针对管理者策略转变的策略应对时,主要关注的就是老板的威胁策略。
对于管理者的策略变化,老板首先会通过通报威胁的方式,使得管理者在确定自己的定价时不会无所顾及,实际上对管理者的行为进行了一定的约束。在这种策略指导下,老板将坚持自己的思路和任务的布置,并采取更加严格的态度和方式,这样做所隐含的威胁就是:管理者要么保持雇佣关系,要么选择离开。这样老板希望通过拉开双方之间的距离而回复到原先的谈判状态,保持老板的优势地位。
3. 管理者的进一步策略管理者虽然具有工作上的先做优势,但还是会迫于老板的“威胁”而不得不顾及后果,但同时又不情愿维持在自身利益得不到满足的均衡点,所以管理者还会做出改善的努力。
在FD公司,对一项具有开拓性质的工作,管理者完成起来具有较大难度,而老板则力推这项工作的实现。此时,管理者将不得不按老板的想法做工作,主旨是一方面在工作上作出有保留的努力,另一方面希望不尽如人意的结果使得老板改变想法。这时,管理者将自身与老板的博弈,转变为外在因素与老板的博弈。比如,由于管理者具有对工作中突发情况的专用性占有的特质,他们可以运用新情况、新问题与老板的原有想法进行博弈,实现一种不完全信息的博弈,而占有较多信息的一方则是具有操控权且可能获得优势的一方;或者,管理者尽可以将新情况、新问题完全抛给老板,由此可以使博弈仅在老板的头脑中进行,而管理者则抽身其外,享受这种博弈以外的轻闲。
那么,掌控全局但却不能明了细节的老板,对于管理者的这种策略则会出现两种反映。一种是缓和的,根据管理者反映的情况重新思考并适当调整自己的想法,这样一来,管理者实际上获得了策略的胜利,可以获得一个新的任务平台,并在此基础上重新考量自身的收益。老板的另一种反应可能是相对激进的,他倾向于不信任管理者的反应,而是采取亲自考察实际工作的作法,这样老板将缩小管理者占有的专用性信息的范围,可以在与管理者的进一步博弈中至少不处于信息劣势。但是,老板涉足具体工作,将部分地掣肘公司的全局工作,而老板的优势地位也在这场信息的较量中被拉下了马。可以预测的是,不论老板有哪种反应,期望维护自身地位的老板和试图获得更多收益的管理者,将由此展开长期的讨价还价博弈。实际上,老板的优势地位将时时受到管理者自利行为的挑战。
4. 老板的改进策略在长期讨价还价博弈中,老板为维护自身的权威地位,在必要的时候,往往会在一定程度内真正地实施威胁。因为老板与管理者基本上是一对多的博弈,如果全面实施威胁,双方最终将以合作破裂结束,而哪怕是威胁的实施方也是不愿意看到这种后果的,所以威胁将在一定程度、范围内实施。
在FD的JV分公司2003年夏天进行的管理改进中,老板W对于一直以来形成的表 2中(2,1)的均衡进行了突破,在各部分发起管理改进运动,甚至撤销了多个中层管理人员,重申了公司实现改进质量、提高效率的目标。这是一次以非合作为代价的调整过程,W通过推行“加强监督”的措施,使得他自己和公司其他管理人员之间面临合作破裂的可能,即管理者不完成而老板加强监督的情况下双方收益为(0,0);实际上也的确有管理人员由于坚持原先的“不完成”作法,而导致实际合作破裂,离开公司,但余下的管理人员则被迫调整策略到“努力完成”,从而实现了博弈的另一个均衡结果,即管理者努力完成而老板加强监督,双方收益值为(1,2)。虽然管理者收益较管理改进前有所下降,但还是较合作破裂导致收益为零好些。而调整过程中,W的收益也可能较如果最初就按照他的意愿完成任务(也就是“先说”博弈中的均衡解)要小些,但只要实现了较“先做”博弈中的均衡解大,就实现了变革的初衷。这里的博弈均衡可能是(1,1.5),老板在管理改进过程中损失了0.5的收益值。整个过程如下所示:
![]() |
表 4 管理改进前的状况 |
![]() |
表 5 管理改进后的状况 |
以破裂相威胁,是摆脱一种既定的博弈均衡的一项策略。它的调整后的均衡取决于哪一方更害怕破裂,这就是说,不是看谁收益更大,而是谁更能承受损失。这是一种包含较大风险的连续博弈,如果实施威胁的一方受到对方的抵制,那么或者双方以合作破裂为代价,导致收益为零,或者保持原来的均衡。那么,运用权力-依赖原则的解释,对于双方的关系依赖性较多的一方承担破裂风险的能力较小,而依赖性较少的一方则承担风险能力较大,往往能够获得对自身有利的博弈均衡。所以在JV分公司的管理改进过程中,老板由于具有更大的风险承受能力,而获得了有利的博弈均衡。
可以说,在这样的挑战不平等的连续博弈中,还有其他因素可能起到作用,如对风险的偏好、意志力、谈判的技巧、对未来的预期等。偏好风险而又意志力坚定的一方,可能获得有利的博弈均衡;掌握谈判技巧可以避免非合作的可能,并在有限程度内使得合作均衡解朝着有利自身的方向发展;至于对未来的预期,则可能成为暂时维持现状的动力(——如在老板占优的情况下,老板对管理者未来晋升的允诺,对于管理者来讲,通过贴现分析可能在虚拟的现实收益中实现对自身有利的均衡结果,那么管理者愿意暂时维持现状)。
在这场雇佣双方之间的长期较量当中,可以看出,最初建立在道德博弈上的和谐合作,将经受生存博弈的实战检验。而最终,似乎我们可以印证宾默尔的理论:“一项社会契约要想具有可行性,它必须是一个生存博弈的均衡。但是有许多这样的均衡,要选择一个均衡,我们一般认为我们进行的是道德博弈,因为在生存博弈中选择‘公平’均衡。(宾默尔,2003:55)”生存博弈的基础性地位几乎不能被撼动,当然,这似乎在我们的“理性人”的前提中就已经预设了。但就是在这样的假设中,也不能妨碍道德博弈在时时发挥着作用,这在博弈双方的博弈底线中能够体现出来。
六、探究双方的博弈底线在长期的讨价还价博弈中,双方的行动规则和范围总是处在一个不断调整的界限中,这个界限给出了双方继续进行博弈而不是抽身退出的底线。双方一直在博弈过程中试探着对方的博弈底线,并调整自己的行动策略仍处于这个界限当中。当然,底线并不是不可突破的,因为雇佣博弈并不是在封闭的游戏圈子中进行,企业本身具有开放性。所以,在达到并突破底线时,这场雇佣博弈将结束,而新的博弈将随即展开;而且,在参与人的选择上,是重复进行的,也就是说,退出一次博弈的行动者仍然具有二次博弈的可能,但先前的记录还是存在的。
雇佣双方的博弈底线具体是什么,或处于什么程度,由于各自情况的不同而有所区别。对于老板而言,如果管理者存在背叛公司、或与自己的意见严重不合、或与期望价值相差甚远等情况中的某项或某些项,则无法继续与之合作;对管理者而言,如果对公司或老板极度不认同、或公司不能提供其基本满足等等,则宁愿选择离开。另外,对于在一个企业中有明确时限、无预期的管理者来讲,自律意识较少,自利、短期的机会主义行为较多,那么博弈底线就较为容易达到;但对于在企业中无时限、有预期的管理者来说,他们希望从企业中获得更多的预期收益,相应地对企业的认同会较多,也会较为克服机会主义作法,那么他们的博弈底线就不容易达到,换句话说,是属于容易合作的一类。
在对博弈底线进行探讨的时候,就需要对生存博弈规则和道德博弈规则进行分别的讨论。一般来讲,博弈底线也就是行动者所能够接受的最小的出价di,当行动者从合作中获得的收益小于di,那么他宁愿选择不合作。这里的di是生存博弈中的最小出价,而道德博弈往往能够对这个底线起到缓解或者推动的作用。如果管理者与老板具有道德博弈基础,即有着良好的关系,那么管理者在达到老板可接受的生存博弈底线时,仍然可以运用道德博弈规则使得老板回心转意,继续维持合作博弈,或者一次博弈结束后管理者仍有机会与老板重新合作,进行二次博弈;但如果达到了老板的生存博弈底线的同时,也动摇了道德博弈基础,也就是对关系造成伤害,那么双重底线就难以挽回了。
下面通过一个“看似不平等的妥协”的例子,来体现双方的博弈底线以及道德博弈与生存博弈的关系。
对于老板占优势的博弈均衡,可能不是老板“先说”的结果,而是管理者看似不平等的妥协结果。这是改变不平等状态的合作博弈失败后,回到最初状态的一种连续博弈的结果。
最初可能是双方都保持原状,管理者希望改变一下现状,于是提出合作终止,希望老板能为了留住自己而调整策略至(2,1)。但是老板实际上同意了合作终止的要求,并没有调整策略的愿望,管理者最终主动调整了自身的策略,回到原状甚至可能在此基础上削减自己的收益,以实现继续合作的目标。所以,最终的均衡可能是原先的(1,2),还可能是(0. 5,2.5),管理者减少自己的收益使得老板收益增加,为了使得合作继续。博弈初期如下表:
![]() |
表 6 博弈初期的状况 |
最终可能与初期一致,也可能在收益的绝对值上有调整:
![]() |
表 7 博弈最终的状况 |
FD公司引进过一位专业咨询人员T,老板W最初承诺T一段时间以后有晋升和加薪。在JV分公司管理改进过程中,W带着T一起进行,但对于T的工作不甚满意。T也对于长期没有实现最初承诺的晋升和加薪有所不满,在管理改进工作开展的后期向W提出离开公司的想法,W没有挽留只是希望T考虑清楚,实际上W对T的离开表示同意,或至少不反对,原因是T在FD公司已经发挥不出期望的作用了。对于W的反应,T经过考虑,撤回了自己的离开要求,表示认同W对公司的长期设计,愿意继续合作,并主动对管理改进过程中未实现的目标表示愿意承担责任,请求扣薪加以惩罚。而W认为,虽然T不能在这个职位上发挥理想的作用,但已经合作了很长时间,公司可以考虑调整T至一个使其能够发挥作用的岗位。最后,W同意T留下来以及扣薪的请求,而随后,W也调整了T的工作职能。
在这个博弈过程中,管理者T在试探中明确了老板W的博弈底线,而后调整了自己的博弈底线,并运用道德博弈的规则弥补了生存博弈的缺陷,而W也认同这套道德博弈规则,从而实现了双方的继续合作。但继续的已经不是原先意义上的合作,从某种意义上讲,T已经进入二次博弈阶段,而一次博弈结束时T获得的评价地位(W会认为T能力不足而又不满现状),必然地影响着二次博弈的初始状况。总体来看,这个过程实际上确认了老板的控制地位。
七、由二人博弈到两组博弈在探讨了广义的雇佣双方二人博弈之后,引入两组博弈(其中一组是相对固定的,即老板本身;另一组是变动的,管理者作为参与人渐次进入博弈)的概念,主要是针对管理者作为一个组,内部可能具有相互影响和作用。
当然,上述的二人博弈实际上只是抽象的例子,其中的管理者可能是管理者A,也可能是管理者B或C,但老板总是W一人。我们将管理者A、B、C等抽象为一个博弈参与者,是因为在与老板W的博弈中,A、B、C作为管理者具有一种行动倾向;如果把关注点放到管理者内部,同样在以老板W为博弈另一方的雇佣博弈中,管理者A、B、C之间也会有相互作用和影响。这就可能涉及两种分析思路,一种是探讨组内传承机制,有无传承影响着在长时期内这组二人博弈是否是具有完美信息记忆的状态,这使得分析仍在二人博弈框架中进行;另一种则可能涉及三方或多方博弈、联合博弈等问题,相对更为复杂,就不作分析了。
对于组内传承,似乎是不言而喻的。新管理者进入企业组织,除了要熟悉和适应工作业务以外,也要不断了解和掌握组织中的环境文化,因为作为理性的行动者,掌握这些信息和能力是接下来指导和调整行动的依据。而且,个体在一个人群内部,行动逻辑遵循这个人群认同的标准是理性的。这是从单个个体的角度分析,从一组人角度讲,人群内部又有相互感染的问题。为迎合他人、求得认同而表达的思想或行为,往往在同伴之间有相互感染、凿实、扩大的现象。这样一来,一方面对自身观点有强化作用,另一方面对他人的思想也实现了统一的强化。于是,人际感染就使得最初的逻辑、标准朝更强化的方向发展。这是一个自发地强化集团意识的过程。由此,这个群体的集团意识和内部文化得到了不断的强化和传承,很多的博弈策略和手段都在组内延续了,使得雇佣博弈在长期内具有相对完美的信息记忆。这样一来,通过使行动者了解过去以及记住群体认同的有关这些博弈的行为惯例,一种非正式的制度就确立下来,并且变得有效运行,这使得老板几乎要和一种制度进行博弈,这无疑加大了老板获得优势的难度。
于是,老板对于组内传承的态度很明显,就是切断可能造成不良后果的传承,比如坚决抵制内部抱怨,或者通过打击、利诱等区别对待来瓦解传承机制等。但这同样给老板提出了新的策略要求,使得两组博弈具有更加复杂的长期实现过程。
八、总结和讨论:协调博弈的摆动均衡在探讨了雇佣双方长期讨价还价博弈后,可以看到,在希望维护自身地位的老板和希望争取更多利益的管理者之间,始终无法形成固定的均衡,而处于摆动均衡状态。也就是说,对于剩余控制权的分配,在长时期内具有相互性。双方很可能处于“你敬我一尺,我还你一丈”的主动合作状态中,或者处于相互提防、相互计算的被动合作状态下。
我们重新回顾肖特的概率单纯形模型,可以看到下图中:B和C点不是博弈均衡点,所以不能实现稳定地停留;A和D点作为两个均衡点,代表着博弈的解。其中,A点是我们探讨的出发点。
![]() |
应当说,在任何阶段的每一次雇佣博弈都将产生一种控制权分配的结果。这个结果的产生条件与前一次博弈结果相关,但这个结果只表明这次博弈带来的控制权分配,而不代表多次的控制权累加;此外,这个结果描述的是一种控制权分配的状态而不是具体的比例,即我们只讨论谁掌握了这次控制权,而不讨论谁以何种比例掌握了多大部分的控制权。14那么,形象地说,在上面的概率单纯形中,每一次雇佣博弈都将产生一个落在A点或者D点的均衡解,而落在哪个点上则由前面的分析给出。最终,我们发现,长期雇佣博弈实际上是个处于A和D之间的摆动过程。15
当然,这种摆动均衡是有界限的,但又是相对开放的。因为,对于雇佣双方而言,他们之间的长期博弈既有各自的博弈底线,又同时面临着二次博弈的可能性。此时,一次博弈的终结结果将影响二次博弈的起始分配,但从长期来看,都还处于一个双方讨价还价的无限期博弈中。在这种长期博弈的状态下,生存博弈与道德博弈的选择及其关系,对博弈双方之间的讨价还价过程有着重要的调试作用。在合作关系良好的企业环境中,雇佣双方可能在生存博弈的基础上衍生或发展道德博弈,使得企业运行中道德博弈起到良好的协调作用。比如,对于企业忠心耿耿的管理者,在与企业长期合作过程中,从企业那里获得了很多依靠,与企业建立起感情,在此基础上,管理者与企业的代表——老板之间的博弈很可能不受生存博弈的约束,而是反映在道德博弈层面上了。而如果企业没有产生出这种道德博弈的环境,则生存博弈起着主导作用。从另一个角度讲,企业的一些运行机制可能在长期的实践中积累形成一种约定俗成的习惯,成为双方进行道德博弈的依据,而此时,生存博弈也需建立在道德博弈的基础上,等等。
应当说,道德博弈的基础是长期形成的。在FD公司,由于约前关系的引入而形成的初期道德博弈规则仍然是朋友圈子、关系网络内部的道德规则,它的实施范围决定了它的性质,与企业内部的生存博弈规则在性质上是不同的,所以很难融合起来。而需要在企业中运行的、能够与企业生存博弈规则相符的道德博弈规则,还没有真正建立起来。这就决定了FD公司中雇佣双方的长期摆动均衡主要是围绕生存博弈的摆动,那么这种摆动就主要依据自利的双方各自的策略和位势的调整。那么设想一下,FD公司长时期内可能由此产生出与自利、策略、位势相关的道德规则,这将是推动生存博弈的道德规则;而不能产生出与缓和、融洽相关的道德规则,这似乎是另一种可以弥补生存博弈缺陷的道德填充物,“道德存在的地方将有效地节约交易成本”,这可能引导至一种更为有效率的状态。
本文关注了一个企业中广泛存在的现象:在雇佣合同规定以外,雇佣双方存在其他的互动逻辑。进一步地,这是广泛存在于任意合同双方之间的现象,由于合同不完全,合同双方存在着较大的自主行动空间,这使得合同的实施充满不确定性16。不仅仅只有管理者具有不实施合同的激励,老板也经常超越合同来要求管理者,或者根据自己的看法区别对待管理者。这个或高或低的“看法”在再缔约过程中也起到很重要的作用,若老板看好管理者甲,期望他有更大的作为,可能在一次违规事件中放松对其的要求;若老板对管理者乙能力评价较低,也可能在同等条件下调低对他的要求。当然,老板的反应与管理者在不同阶段的不同状况以及老板对这些状况的了解有密切的关系。这就引申出了一个问题:合同的作用到底是什么?初次合约到底有什么作用?合同对雇佣双方而言,似乎仅仅是一个表明双方关系的凭证,或者是一个达到博弈底线时用以提起雇佣诉讼的依据。
达成合同是合同双方合作博弈的标志,但不论是签订还是实施过程中,双方时时进行着非合作讨价还价博弈,这说明什么?说明合作博弈中永远蕴涵着非合作博弈的具体实施,或者说合作关系是脆弱的,一直会受到非合作可能性的威胁和挑战。刘世定教授曾指出,合作的产生,有两类不同的原因。一是参与者的终极预期上,意识到对方的存在比取代对方更有利;二是在终极目标上虽试图完全取代对方,但力量不足,在此情况下,与其持续冲突不如转而合作。这两种认识,可能都从多次博弈中产生,但意义不一样。17那么,不具有终极预期的个体,又希望能够在双方较量中获取收益,于是自利的追求一次次地影响博弈过程,实际上合作博弈仍难达成。
注释:
1 FD公司是一家有十多年发展历史的私营企业。经过了众多的行业尝试和努力,它逐渐成长为一家中等规模的企业集团,目前拥有两家主要的分公司,涉及不同的行业领域。在参与观察阶段,笔者作为FD公司总裁W(也是创始人)的兼职秘书,主要在FD公司的总公司实习,期间也跟随W分别到过两家分公司。由于笔者的实习方式,便于较多地观察到总裁W与总公司、各分公司的高级和中层管理人员之间的实际互动,由此促动了这项研究题目的形成。
2 其实这种尝试运用了参与观察的另一种便利性,就是:通过不断地有意无意地将观察到的现实与观察者头脑中不断积累的理论准备相磨合和碰撞,观察者可以获得一些经过初步加工和分析的、对于研究对象的实质感受,或者简称“实感”。这种实感或许是在参与观察中获得的更为宝贵的素材,本文的分析也更多地建立在这样的素材基础上。
3 哈特对人力资产问题仅作了有限讨论,见后面分析。
4 关于“占有”的详细论述请参见刘世定,1996。
5 针对剩余收入的控制权,有许多学者研究(阿尔钦和德姆塞茨,1972/2002;张维迎,1999;杨小凯和黄有光,1995/1999),均称之为“剩余索取权”。最先是由阿尔钦和德姆塞茨(1972)提出的,是指获得团队净收益的权利。
6 哈特对此表述为:某一方当事人将其所拥有的资产越是专用性于特定契约关系中(并对契约盈余有重要影响),那么他就更应该拥有另一方的资产。这是获取剩余控制权并且将事前投资扭曲最小化的最好方法(Crossman and Hart, 1986/1998,708)。
7 双方的收益值只表示一种定序的大小关系,没有定矩的具体含义。
8 对于肖特的具体论述,请参见:安德鲁·肖特, 2003, 《社会制度与经济理论》第三章。
9 根据风险分配的基本原则:风险分配应该与合同双方承担风险的取向成正比,即哪一方能够承担更大的风险,就应该承担相应比重的风险。所以形成雇佣合同中员工辞职容易,企业开除员工困难的现象。
10 “先说”机制是在两个均衡解中确定唯一解的一种机制,理论上两个均衡都有成为最终解决办法的可能,现实中也如此,老板和员工都可能妥协,因为前提是不妥协即破坏合作。
11 对于信号博弈更为详细的描述,参见:罗伯特·吉本斯,1999。
12 传统的人力资本理论都是着眼于人的外在的增长,包括知识、技能、体力等,是物理(physical)的部分;而企业中的人在增进这些的同时,也发生思想、意识上的变化,这是精神(me ntal)的部分,包括企业文化所涉及到的忠诚、归属等等属于适应性的部分,还包括机会主义的新形式等属于变通性的东西——本文在这里主要讨论的也是这部分内容。
13 对此企业并非毫无反映。克莱因(1978/2000)等人认为,一个成长中的企业对劳动者进行欺诈的成本会高于将来(就业增加)的工资增加,其不得不为欺诈付费。反过来讲,企业针对劳动者欺诈的反映也经过成本收益计算。比如双薪,不是企业价值观或文化使然,是因为未来需求的高增长率使企业采用这种方法花费相对更少。
14 或者可以说,我们将获得控制权的一方的控制比例推向极端,即认为他以1(100%)的比例获得了控制权。
15 当然,如果我们不对具体的摆动次数(即分别落在A点的次数和落在D点的次数)做统计的话。事实上,这种统计是理想而无法操作的,因为长期雇佣博弈是一个连续的过程,我们甚至找不到其中的断点。所以我们只能说长期雇佣博弈是由单次博弈构成的,但无法知晓是由多少次以及哪些次博弈构成的。
16 本文讨论的合同实施是存在于两方框架内的,没有涉及第三方的作用。两方合同的确具有更多的不确定性,但这也促成了许多有意思的研究,其实关系合同理论、剩余控制权理论所关注的都是针对两方合同不确定性的弥补机制。本文所感兴趣的也在于此:雇佣双方如何在一个仅有两方的环境内实现各自的目标收益;此时他们只有调整自身策略和影响对方策略两件事可以作,但在长期内,整个过程充满了双方斗智斗勇的玄妙和精彩。如果引入第三方,可能能有效缓解两方不确定性,但三方之间的互动博弈会更加复杂。
17 见于刘世定教授的读书笔记《Tracing》,内部学习稿。
安德鲁·肖特, 2003, 《社会制度的经济理论》, 路铭、陈钊译, 上海财经大学出版社。 |
奥利弗·哈特, 1998, 《企业、合同与财务结构》, 费方域译, 上海三联书店/上海人民出版社。 |
Y·巴泽尔, 1997, 《产权的经济分析》, 费方域、段毅才译, 陈昕主编, 上海三联书店/上海人们出版社。 |
肯·宾默尔, 2003, 《博弈论与社会契约》(第一卷)《公平博弈》, 王小卫、钱勇译, 上海财经大学出版社。 |
彼得·布劳, 1988, 《社会生活中的交换与权力》, 孙非、张黎琴译, 华夏出版社。 |
刘世定, 1996, 《占有制度的三个维度及占有认定机制——以乡镇企业为例》, 载于潘乃谷、马戎主编, 《社区研究于社会发展》(下), 天津人民出版社。 |
——, 1999, 《嵌入性与关系合同》, 《社会学研究》第四期。 |
罗伯特·吉本斯, 1999, 《博弈论基础》, 高峰译、魏玉根校, 中国社会科学出版社。 |
约翰·纳什, 1950/2000, 《纳什博弈论论文集》, 张良桥、王晓刚译, 首都经济贸易大学出版社。 |
斯彭斯, 1973/2002, 《劳动力市场的信号发送》, 《阿克洛夫、斯彭斯和斯蒂格利茨论文精选》, 谢康、乌家培编, 商务印书馆。 |
张维迎, 1998, 《詹姆斯莫里斯论文精选——非对称信息下的激励理论》, 张维迎编, 商务印书馆。 |
——, 1999, 《企业理论与中国企业改革》, 北京大学出版社。 |
周其仁, 1996, 《市场里的企业: 一个人力资本与非人力资本的特别合约》, 《经济研究》第6期。 |
Alchain A. A. & Pemsetz, H. Demsetz. 1972/2002. 《生产、信息费用与经济组织》, 《财产权利与制度变迁——产权学派与新制度学派译文集》, R. 科斯、A. 阿尔钦、D. 诺斯等著, 陈昕主编, 上海三联书店、上海人民出版社。 |
Becker, G. 1962/2000. "Investment in Human Capital A Theoretical Analysis. "转引自Oliver Williamson, Wachter M., Harris, J., 《理解雇佣关系: 对专用性交换的分析》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Coase R. 1937/2000. 《企业的性质》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Doeringer, P. & Piore, M. 1971/2000. International Labor Markets and Manpower Analysis, 转引自Oliver Williamson、Michael Wachter and Jeffrey Harris, 《理解雇佣关系: 对专用性交换的分析》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Furubotn, E. G. & Richter, R. 1998. 《新制度经济学: 一个评价》, 《新制度经济学》(中译本), Furubotn, E. G. and Richter, R. (编), 上海财经大学出版社。 |
Grossman, S. & Hart, O. 1986/1998. 《所有权的成本和收益: 纵向一体化和横向一体化的理论》, 载陈郁主编, 《企业制度与市场组织——交易费用经济学文选》, 上海三联书店/上海人民出版社。 |
Harsanyi, John C. 1975/2003. "The Tracing Procedure: A Bayesian Approach to Defining a Solution for n-Person Non-cooperative Games. "转引自肖特, 《社会制度的经济理论》, 路铭、陈钊译, 上海财经大学出版社。 |
Hayek, F. A. 1945/2000. "The Use of Knowledge in Society. "转引自Williamson, O., Wachter, M., Harris, J., 《理解雇佣关系: 对专用性交换的分析》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Jensen, M. & Meckling, William. 1976/2000. 《企业理论: 经理行为、代理成本和所有权结构》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Klein, B., Crawford, R., Alchian, A. 1978/2000. 《纵向一体化、可占用性租金与竞争性缔约过程》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
Macneil, I. R. 1998. 《关于关系合同的思考》, 载Furubotn, E. G. and Richter, R. (编), 《新制度经济学》(中译本), 上海财经大学出版社。 |
Williamson, Oliver, E. 1979/1998. 《交易费用经济学: 契约关系的规则》, 载陈郁主编, 《企业制度与市场组织——交易费用经济学文选》, 上海三联书店/上海人民出版社。 |
——. 1985a/2000. 《合同关系的治理》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
——. 1985b/2000. 《企业的约束: 激励和行政特征》, 载路易斯·普特曼、兰德尔·克罗茨纳编, 《企业的经济性质》, 孙经纬译, 上海财经大学出版社。 |
——. 2001. 《治理机制》, 王健、方世建等译, 中国社会科学出版社。 |
Yang, Xiaokai & Ng, Yewkwang. 1995/1999. 《Theory of the Firm and Structure of Residual Rights》, 载自张维迎, 《企业理论与中国企业改革》, 北京大学出版社。 |