经济理论该如何回应行为“异象”挑战

显示缩略图
本文结构
摘要
关键词
Abstract
Keywords
一、引言
二、行为异象对经济理论的挑战
(一) 指向“偏好不一致”的行为异像
(二) 行为不一致是真的是偏好不一致吗
三、引入情景依存偏好
四、BPC模型的未来
五、(并非)结束语
参考文献

引用本文

董志强. 经济理论该如何回应行为“异象”挑战—来自桑塔费学派的看法[J]. 南方经济, 2018, 37(2): 12-22. 复制到剪切板

Dong Zhiqiang. How Should Economic Theory Reply the Challenge of Human Behavioral Anomalies: View from Santa Fe Economists[J]. South China Journal of Economics, 2018, 37(2): 12-22. 复制到剪切板

作者简介

董志强，郑州大学西亚斯国际学院，E-mail:dongzhq@qq.com，通讯地址:河南省新政市人民东路16号，邮政编码:451150

Contents Abstract Full text Figures/Tables PDF

经济理论该如何回应行为“异象”挑战—来自桑塔费学派的看法

董志强

作者简介：董志强，郑州大学西亚斯国际学院，E-mail:dongzhq@qq.com，通讯地址:河南省新政市人民东路16号，邮政编码:451150

作者文责自负

摘要：行为经济学研究不是要挑战主流经济学的理性行动者模型（BPC模型），而是要改造和完善BPC模型。许多不一致的偏好和"非理性"的行为，只要加入情景因素便可得到合理的解释。经济理论对人类行为"异象"挑战的正确回应，不是抛弃BPC模型，而是考虑偏好的情景依存性和进化心理机制对BPC模型进行修正和改造。

关键词：理性行为经济理性行动者模型主流经济学

How Should Economic Theory Reply the Challenge of Human Behavioral Anomalies: View from Santa Fe Economists

Dong Zhiqiang

Abstract: The study of behavioral economics is not trying to challenge the rational actor model (also called BPC model) of mainstream economics (BPC model), but to revise and improve the BPC model. Many inconsistent preferences and "irrational" behavior could get reasonable explanations, as long as their situations are considered. The correct response of economic theory to the anomalies challenge of human behavior is not to abandon the BPC model, but to modify and improve the BPC model with the situation-dependent-preferences and evolutionary psychological propensity considered.

Key Words: Rationality Behavior economics Rational actor model Mainstream economics

一、引言

“理性”一词的涵义，即便在最崇尚“理性”的经济学中，也充满争议。当代主流经济学将其定义为：偏好满足完备性和传递性(贝克尔, 1995, p.187；Mas-Collel et al., 1995；平新乔，2001)。偏好的完备性是指参与人能就所有备选方案逐一比较，任意两个方案之间要么有优劣之分，要么没有差异；偏好的传递性则是指参与人可就所有备选方案进行排序，且任意两个方案之间的优劣关系应该与这两个方案在所有方案中的优劣关系是一致的。

满足一致偏好关系的“理性”，并不意味着自私自利。正如Gintis(2009，p.6)所说：“关心他人、信奉公正，或者为社会理想而牺牲，没有什么是不理性的。这些偏好也并不与决策理性相抵触。”自私自利方式下的理性行为，不过是一致性方式下理性行为的一种特例(Sen, 2008)。个体将自身利益之外的变量(如强互惠、公平、忠诚、忌妒、内疚、羞耻等等)纳入其行动目标，并不会违背“理性行为”所要求的一致性。也因为如此，“理性人”才成为取代“经济人”的一个强大术语。

个体偏好“应该”是一致的。因为从长期来看，偏好不一致的非理性个体会被偏好一致的理性个体持续剥夺而在生存竞争中处于劣势(黄锦鹏、董志强，2014)。换言之，不一致的偏好存在生存缺陷，它们在市场竞争中更可能被淘汰。同样的道理，从生物进化的角度来看，进化出一致性偏好的有机体，应该比没有进化出一致性偏好的有机体更有竞争优势。的确，起源于进化生物学的偏好一致性研究(Robson, 1995)，表明这一理论可以很好地运用于昆虫和庄稼(Real, 1991; Alcock, 1993; Kagel et al. 1995)。

偏好的一致性，是理性行动者模型的前提。所谓理性行动者模型，又称为BPC模型，即考虑信念、偏好和约束(BPC，Beliefs, Preferences and Constraints)模型，这是现代经济学中广泛接受的建模思想。偏好确定了决策主体所评估的各种行动可能产生的价值。只要有一致偏好，便不会有不同行动之间的价值冲突。BPC模型的良好运作也只需要具有一致偏好即可。

在最近三四十年，实验经济学和行为经济学的兴起，展示了许多看似“非理性”甚或反常的行为异象，导致人们对BPC模型多有批评，甚至有声音主张要放弃BPC模型。本文从桑塔费学派的立场出发，认为BPC模型并未面临严峻的挑战；只要考虑到偏好的情景依存性，许多偏好不一致的非理性“异象”都可得到合理解释。重要的不是抛弃BPC模型，而是改造和运用BPC模型。

二、行为异象对经济理论的挑战

为集中笔墨，本节讨论聚焦于那些指向偏好不一致的行为异象，因为这是最容易被人们冠以“非理性”的情形。

(一) 指向“偏好不一致”的行为异像

此类行为异象，多见于跨期选择领域。经济学家对跨期选择的关注由来已久，从Jone Rae(1834)到杰文斯父子(W. S. Jevons and H. S. Jevons)，再到庞巴维克(Böhm-Bawerk, 1889)、费雪(Fisher)，最后到Samulson(1937)和Koopmans(1960)，经济思想史上一系列伟大的头脑都深入涉及过跨期选择问题，并最终以简洁优美的指数贴现效用模型作为标准分析框架而告终。但过去三四十年间的许多实验研究表明，人们的行为并不象贴现效用模型所刻画的那样(即贴现率不随时间变化)，贴现率是随不同跨期选择行为变化而变化的。

比如，在Thaler(1981)的一项经典研究中，实验人员要求被试设定其需要的货币量，使得他们在1个月后、1年后和10年后获得这些货币与现在就获得15美元的货币感觉是没有差异的。结果，被试设定的货币量之均值为20、50、100美元，从而，对应的1个月、1年和10年的平均(年)贴现率就分别是345%、120%和19%。在另一项有趣的研究中，Ainslie和Haslam(1992)要求被试在实验当天获得10美元和一周后获得11美元之间做出选择，大多数被试选择了立即可得到的10美元。但是，同样的被试，在面临实验日之后1年得到10美元和实验日之后一年又一周后得到11美元之间，那些不愿为额外的10%而多等待一周的被试，现在大多又愿意为了额外的10%而多等待一周了。

大量的研究提供了一边倒的证据，这些证据都反对了贴现效用模型，贴现率不是固定不变的(Benzion et al., 1989; Chapman, 1996; Pender, 1996; Redelmeier and Heller, 1993)，人们存在偏好的逆转(Green et al., 1994; Kirby and Herrnstein, 1995)，即两种奖赏都提前时会更偏好于更临近的奖赏。甚至在动物(如鸽子)身上也能观察到这种偏好逆转现象(Ainslie and Herrnstein, 1981; Solnick et al., 1980)。

此类行为异象不仅出现在时间跨度上，也出现在其他的情景效应之中。比如，Thaler(1981)发现的“符号效应”和“量值效应”。在Thaler的调查中，被试将获得一张兑奖券，可以现时领奖，也可以在未来(3个月、1年或3年后)领奖，并要求被试写下愿意为推迟领奖而要求的补偿金额；这个实验中得到的贴现率低于用货币收益进行实验得到的贴现率。也就是说，在奖券实验中，被试对未来收益表现得更加在乎。仍然是在Thaler(1981)的调查中，发现人们面对小额收益时的贴现率比大额收益时的贴现率要大一些，实验表明今天的15美元和1年后的60美元，今天的250美元和1年后的350美元，今天的3000美元和1年后的4000美元，对于被试是没有差异的，这意味着相应的贴现率为139%，34%和29%。

另一些研究发现，人们面对损失和面对收益也有不一致的表现。相当一部分被试偏好损失马上发生而不是延迟发生(Loewinstein, 1987; Redelmeier and Heller, 1993)，这说明这些被试对未来的损失赋予了较低的贴现率(很在乎未来的损失)。人们对“延迟”和“提前”要求的补偿也是不对称的，Loewinstein(1988)证明，相对于时间参照前，时间收益提前和延迟对于贴现率也有显著影响。比如，有可能在1年后得到一台录像机的人，愿意为提前到现在得到一台率相机支付54美元；但现在有可能得到一台录像机的人，愿意为延迟到1年后得到录像机而要求的补偿却是126美元。其他一些人(Benzion et al., 1989; Shelley, 1993)的研究也得到了与此类似的结论。

在美好与不舒服的跨期选择中，也出现了一些“异象”。曾经有个故事说：在一堆葡萄中，有人从最差的一颗开始吃，到最好的一颗结束，他每次吃到的都是最差的葡萄，但总体上他的生活是越来越美好的；有人从最好的一颗开始吃，到最差的一颗结束，他每次吃到的都是最好的葡萄，但总体上他的生活越来越糟糕。那么，现实中人们究竟如何吃葡萄呢？研究者们的回答是：大多数人偏好第一种吃法。Varey and Kahneman(1992)发现，即便在一定时段内不舒服的总量一样，人们也偏好递减的不舒服流(stream of discomfort)甚于递增的不舒服流。Chapman(2000)让被试假想头疼，头疼持续时间包括1小时、1天、1月、1年、5年、20年，被试可以选择头疼随时间逐渐减轻或逐渐加重，结果大多数(82%~92%)的被试偏好头疼随时间减轻。对于美好的东西，研究显示人们偏好递增的收益流序列。比如Loewinstein and Prelec(1993)发现，在一系列(如宴会、假期旅行等)事务安排中，被试一般偏好于把更美好的东西留在更后面；Loewisntein and Sicherman(1993)发现，对于各方面相同的工作，被试更乐于接受的工资序列是递增的工资，而不是递减或固定不变的工资。

(二) 行为不一致是真的是偏好不一致吗

我们基于某些一致偏好假设，认为人类行为应该如此，但实验结果却并未如此，于是我们断定人类行为背离了一致偏好假设。这在逻辑上是否存在问题？须知，行为背离某些(情形的)一致偏好假设，并不能表明行为背离(所有情形的)一致偏好假设。身体不舒服会令婴儿啼哭，但没有人会坚决认为婴儿啼哭必定代表着他身体不舒服。同样，观察到行为不一致，可能并不必定代表偏好不一致，并不必定意味着非理性。所谓非理性行为，既可能是行为失误(performance error)，更可能是特定情形的理性行为。

考虑前面曾提及的Ainslie and Haslam(1992)的实验。令x为时期t得到的10美元，令y为时期t+7得到的11美元，这个实验得到的所谓“不一致”行为就是：当t=0时有x>y，而t=365时却又出现了y>x。但是，这个分析不够深入。对于被试来说，我们同时得到了x>y和y>x，由于偏好的完备性公理要求x>y和y>x不得同时成立，因此承认实验结果违背偏好的一致性，那也就必须承认它违背了完备性。由此可继续追问，若建模时允许个体在更复杂或更高级的选择空间上进行选择，使得个体偏好的完备性并不被违背，这是否会让我们得到实验行为结果和一致性偏好能够兼容的解释？

的确，如果将个体进行选择的时刻与目标达成时刻之间的时间距离纳入当事人的效用目标之中，“时间不一致性就会消失无踪”(Gintis, 2009, p.10)。比如，令x₀为“立即得到10美元”，令x₃₆₅表示“自现在起365天之后得到10美元”，y₇, y₃₇₂可类似定义。那么，x₀>y₇同时y₃₇₂>x₃₆₅这样的实验结果就并不会违背偏好的一致性(Gintis, 2009)。

微观经济理论家鲁宾斯坦(2007，p.4)曾讨论传递性在何时可能被违背。他讲了三种情形。情形一是想法的汇总造成非传递性。譬如有一个人，关于物品x、y、z的偏好序最初有三种想法，分别为x₁>y₁>z₁、x₂>y₂>z₂和z₃>x₃>y₃(下标为想法代号)，那么在想法汇总时就会出现x>y且y>z且z>x的背离偏好一致性的结果。情形二是相似性的使用阻碍了传递性。在一些决策情形，决策者对太过于相似的以至难以区别的两个元素进行比较时，会认为他们是无差异的。假如决策者对物品希望“多多益善”，但允许一个模糊区间，比如评价差异在1之内就认为两种物品无差异，那么当|x-y| < 1时有x~y，同样|y-z| < 1时有y~z；但是|z-x| < 1时也有可能出现|z-x|>1，从而z~x不会成立，于是出现了偏好不一致的结果。情形三是我们考虑的条件太少了(遗漏了条件)。非一致偏好的出现，有可能是我们关于理性的假设太弱了，或者，是我们对偏好概念未附加更为合理的约束。倘若附加其他类似的一致性条件，被认为是非一致的偏好也可以是一致的。

鲁宾斯坦讲的第一种情形，就个体而言实际上不太可能长期存在，因为个人不可能长期保持相互矛盾的想法。他所讲的情况更适合看作是三个不同的人有不同的偏好，这可以说明即使三个具有一致偏好的“理性”个体，汇总成一个集体时也可能遭遇非理性(非一致偏好)的问题。第二个情形纯粹是模糊评价所致，倘若人们能精确比较两物品，就不应出现这样的情况。第三个情形则揭示出我们有可能误解了偏好的一致性，漏掉了偏好一致性的约束条件却指责人们的偏好背离了一致性。恰如印度诗人泰戈尔所说：我们看错了世界，却说世界欺骗了我们。

也有许多证据表明，人们具有不同的贴现率。Frederick et al.(2002, p.378-379)的综述文章列出了40多项实验研究或现场研究比较人们的贴现率，发现人们的贴现率差异很大。从迷恋完美市场的新古典经济学视角来说，这是不太符合理性的，因为新古典均衡中所有物品均应按同一利率出售。然而，将此归结为非理性将是非常草率的。毫无疑问，市场从来没有完美过，而人们看重的诸多事物也并不在市场上出售或买进(Gintis, 2009)。每一桩交易，每一个行为，都是在特定情境中发生的，但新古典经济学理论抽象掉了交易的情景，不考虑每个行为中人们对行为适宜性的考虑。很可能正是分析人类行为时遗漏了这些条件，才造成我们觉得人类某些行为“不理性”，甚至匪夷所思。

三、引入情景依存偏好

一旦引入被遗漏的条件，那些看似不一致的偏好就可以是一致的。这些被遗漏的条件，实际上是被忽略了的情景约束。已经有越来越多的研究证实人类的偏好是情景依存的，引入情景依存偏好也可以解释更多的被部分经济学家视为非理性的行为，比如损失厌恶、禀赋效应、现状偏见等等。

所谓情景依存偏好，桑塔费经济学派代表人物Bowles(2004, p.103-104)是这样定义的：令ω_i是表示状态i的向量，它是所有可能状态集合Ω中的一个元素，u_i(ω_j)是状态ω_j∈Ω对于一个正在经历状态ω_i的个体的效用。如果存在一定的i和k使得u_i(ω)和u_k(ω)不同(即该个体经历不同状态时对各种状态ω之评价是不同的)，那么该个体的偏好就是情景依存的。情景依存性(situation dependence)本质上是状态依存性(state dependence)，Bowles使用情景依存性这一术语，是为了体现心理学中关于情景行为影响的大量文献的重要认识(Bowles, 2004, p.104)。

用生活中的例子可以轻松地讲清楚偏好的情景依存质。一个典型而有些极端的例子是，我们在人前和人后的表现很不一样。比如，人们不会在大庭广众之下盗窃，尽管盗窃收益可能很高；而无人在场的时候，对一些价值不高的物品，人们也可能顺手牵羊(可能很多时候是出于无意识的)。当然，读者可能会对这一例子提出新古典经济学式的反对：大庭广众之下更容易被发现，人们要计算盗窃被抓获的概率行事。这种批评当然有道理，但实验发现，即使人们不会被抓获，情景的变化也影响着人们的盗窃行为。比如，英国一大学的茶水间设有“诚实盒”，员工将茶或咖啡的建议价格贴到墙上，每次享用自觉将相应的费用投入诚实盒。接下来的10周里，研究者在价格表上方分别隔周贴上“眼睛”和“鲜花”的图片，结果发现，眼睛周“诚实盒”的钱明显高于鲜花周，前者平均为后者的三倍。在这个实验中，不诚实(相当于“盗窃”)是不会被抓获的，但“眼睛”和“鲜花”的情景设定改变了人们的行为。另一个有趣的实验是，同样内容的申报问卷分作两种签名情形，一种是填完表格再在尾部签名，另一种是在表格顶部签名再填表。结果，研究人员发现底部签名条件下参与者谎报的信息是顶部签名条件下参与者谎报信息的4倍。研究人员的解释是，底部签名仅代表信息确认，而顶部签名相当于“道德提示”。^①但无论如何，不同的签名情景设置影响了人们的行为。

① 见艾瑞里(2012)。对不诚实行为的研究，杜克大学心理和行为经济学教授艾瑞里(2012)的通俗之作《不诚实的诚实真相》有很多有趣实验介绍。

行为经济学著名的前景理论中，存在一个损益的参照点。而参照点的存在和变化，本身就是情景依存偏好的一种证明。不同的参照点，等于设定了不同的决策情景。参照点究竟是如何选择的？前景理论中并没有讲。如果按照前面对情景依存偏好的定义，那么参照点应当是“人们正在经历的状态”(即现状)，因为对ω状态序列的评价，正是在个体经历的状态ω_i下进行的。人们根据对现状的背离来确定收益和损失，损失厌恶、禀赋效应，都应该是一类更为广泛的情景依存效应—现状偏见(status quo bias)—的两个例子(Bowles, 2004, p.104)。

毫无疑问，现状会有时间维度。经历了损失的个体，虽然痛苦，但在足够长的时间之后，痛苦的经历最终成为常态，预见到这种痛苦在将来无法摆脱便会产生“认命”或“知足”的心理；而经历了快乐的个体，预见到这种快乐是长期的，也会产生新的更美好的期待。这种心理变化，导致新的现状参照点的形成。在心理上，存在一种叫常规化的心理机制，让我们的情绪状态可能迅速恢复。我们对消极状态的记忆通常比想象的要短，也能够从消极或积极的事件中迅速恢复(Wilkinson, 2008)。生物和人的实验研究证实了现状参照点可以发生改变。比如，人们得不到一件东西越久(比如食物)，对其评价就越高；在莫扎特音乐中被抚养的老鼠，喜欢莫扎特音乐甚于勋伯格音乐；获得赠送杯子的学生，立即不愿以市场价格转让杯子(禀赋效应突然产生)。

现状有时间维度意味着，所谓损失厌恶、禀赋效应，都更适合解释较短时期的行为，因为长期中偏好是内生的。这应该是符合现实的，股票回报之谜就是一个例子。美国的股票回报远高于债券回报，这在经济学中是一个著名的谜团。一种解释是投资者风险厌恶，但要使得风险厌恶可以解释股票回报之谜，投资者的风险厌恶必须达到很高的程度，但事实上大多数投资者是很富有的，没有那么高的风险厌恶；另一种更令人信服的解释是，投资者并非厌恶风险本身，而是对损失的前景反应强烈(损失厌恶)，毕竟一年中股票回报为负的时候要比债券回报为负的时候多得多。但是，倘若放宽投资者的视界，比如他关注的是五年的投资期界，他将很少遇到回报为负的情况。这意味着，基于损失厌恶的解释必须附加一个较短的期限，在长期中人们不断根据情形的变化将新的情景视为现状。

现状参照点的改变和偏好长期内生，也可用于分析本文第三部分的时间偏好不一致性问题。将时间t作为影响效应的变量加入到个体的效用函数，时间偏好不一致问题就迎刃而解(Gintis，2009)。但是，为什么应当加入时间t这一因素呢？一个符合直觉的理由是：在不同的时间跨度中，我们对多等待同样长时间的评价是不一样的。等待1天和等待7天，差别是7倍；等待365天和372天，差别不到2%。换言之，我认为等待1天和等待7天差异很悬殊的，而等待1年和等待1年又一周没太大差别。我只关心当下能拿到手的现金，对于一年之后的事不太关心—直到到了明年的那一刻，我有了新的现状参照点，我的偏好发生了逆转。

接下来需要继续探讨的问题是，人类何以会有情景依存的偏好？这一问题的回答可能要回到“演化”中去寻找。比如，参照点涉及到生物学的自身稳态(homeostasis)和协同稳态(allostasis)机制(Wilkinson, 2008)。这两个机制是进化适应性的。自身稳态说的是这样一个原理，生物体中的各种系统会形成一个最佳的稳定点，而且相对着一定的偏离将会引发使其回归到稳定点的负反馈过程。一个典型的例子是生物体的体温，当体温过高或过低，生物体的系统就会发挥作用试图恢复到正常的体温水平。血糖水平、电解质平衡等也是这样的例子。协同稳态说的则是，某个变量可以随环境变化而调整，但仍是在正常的状态中，比如心跳、血压、荷尔蒙水平就是这样的变量，它们不像体温那样恒定，而是可以有较大的正常变动范围。在运动中，为了达到最佳运动状态，心跳会加速、血压会升高。也有研究表明，“幸福感”也是这样的协同稳态变量。参照点现象，大概与人的这些生理和心理特征有紧密联系。^①

① 在现实中，人们曾做过这样的实验：让一个人将一只手放在热水桶中，另一只手放在冰水桶中，一段时间之后，再抽出双手将两只手放于同一桶温水中，这时实验对象会感绝倒一只手有冰的感觉而另一只手有热的感觉。实际上现在两只手面临的外部温度是一样的，理应有相同的感受，而且我们知道这是个事实，但是我们的大脑却为两只手选择了不同的参照点，以至于两只手有完全不同的感受。这是参照点现象的身体或生物实例。

类似地，损失厌恶和禀赋效应，也应是演化而来的心理机制。生活环境特别是远古人群的生活环境，充满凶险、不确定性，得到更多的收益固然有利于生存和繁衍，然而这主要是一种锦上添花式的生存质量提高；遭受与收益等价的损失，人们牺牲的代价与收益带来的好处其实是并不对称的。收益让人生存得更好，而亏损却可能让人彻底出局。譬如沙漠中行走，少一壶水可能让人面临灭顶之灾，而多一壶水不过是让人可以更舒服一些而已。这种损失代价和得益好处的非对称性，有可能就是损失厌恶和禀赋效应得益心理机制得以形成的演化基础。

四、BPC模型的未来

起源于边沁等人的理性行动者模型，或者说BPC模型，是当代主流经济学理论的核心，但是它也饱受批评。其中流传最广的批评，来自诺贝尔经济学奖得主Simon(1982)，他认为进行信息处理代价高昂，且人类信息处理能力极其有限，故个人追求满意的利益而非最大化的利益。由此一个隐含的观点是，应当抛弃BPC模型。最近三四十年行为和实验经济学发现的“异象”，导致对BPC模型的批评更加激烈。

然而，桑塔费学派的Gintis和Bowles等人主张，BPC模型不应放弃。行为经济学的研究不是要挑战主流经济学的BPC模型，而是改造和完善BPC模型。在Gintis(2009)看来，BPC模型仅要求偏好的一致性，而这个偏好的一致性可谓得到了基本的演化理由的支持。尽管有好些针对偏好一致性的强烈批判，但那些批判意见只在非常狭小的范围内成立。偏好一致性无需预设人们有无限的信息处理能力和完美的知识，即便有限理性也与BPC是相符的。的确，可以证明，每一个有限理性个体，均是受恰当的与自然状态有关的贝叶斯信念约束的完全理性个体(Zambrano, 2005)。许多偏好不一致的行为“异象”，只要加入情景因素便可得到合理的解释。这意味着我们所发现的“异象”，并非真的异象，而是我们误设决策者偏好函数的概念之失；除非，决策者个人不清楚自己的偏好。假定个人清楚其偏好，再附加上与选择空间关系重大的个人现状信息，就可以消除偏好的不一致性。更重要的是，这种附加是完全合理的，因为我们必须将决策者现状信息包括进来，否则偏好函数便没有任何意义。当我们饥饿、恐慌、困乏或者性饥渴之时，我们的偏好顺序便会相应地调整。想找到一个不依存于我们当前财富、当前时间或当前策略环境的效用函数，这种想法既不合理也不切实际。(Gintis, 2009, p.2)

考虑偏好的情景特征是理解理性行为的重要钥匙。利用BPC模型进行经济理论建模，需要考虑行为的情景特征，而几乎不考虑情景因素的主流经济学恰好忽略了这一点。行为经济学的一个重大贡献是确认了社会偏好的存在，其实社会偏好就是情景依存的。或者说，是社会为人们的偏好设定了许多不同的框架。因而，考虑社会背景和社会偏好，是利用BPC模型分析真实世界人类行为的一个关键方面。

首先，在面临陌生环境的时候，人们总是会进行启发式推断，寻找生活中相似的情景，然后选择自己认为恰当的行为。比如Jean Ensminger给肯尼亚牧民奥玛人(Orma)做了一个公共品实验。在奥玛人的生活中，当他们需要某种公共品(比如建设一所新的小学或修缮一条道路)时，会要求社群成员为该项目进行捐赠，捐赠额随家庭的财富(牛的头数)增加而增加。这种自愿供给公共品的体系被称为Harambee ^①。当Ensminger向他们解释公共品博弈时，奥玛人立即称该实验的博弈为Harambee博弈，而他们在实验中的表现，可以由他们在现实世界中的财富很好地加以预测；但是，当实验改为最后通牒博弈，奥玛人就不会将其类比为Harambee，并且他们在现实世界中的财富不能预测其在实验中的表现。

① Harambee的意思是“齐心协力”。

其次，情景引致的信念不同，可以导致完全不同的结果。如果一个情景引致某个互惠者对其他人的信念都是利他者，这个互惠者就会表现出慷慨，结果可能通向群体中较高的慷慨水平；反之，同样的个人却可能在另一个情境中采取给双方带来有代价的恶意惩罚(Bowles, 2004, p.122)。我们也不妨考虑这样两个人的交往：甲是自利者，乙是互惠者，并且他们彼此都知道对方的类型。然后，让他们进行合作或背叛的博弈。如果甲先行动，他知道乙作为互惠者会以其人还治其人之身，因而尽管他是一个极度自私的人，但是他会选择合作以避免乙的背叛，结果合作成为可以持续的结果。但是把程序反过来，如果乙先行动，由于他知道甲嫉妒自私会在自己选择合作后背叛自己，所以他一开始就会选择背叛甲，结果就是共同背叛。这个例子也说明，微小的制度差异，可以产生出天渊之别的结果差异。这大概也是institution matters(制度至关重要)的另一诠释吧。

五、(并非)结束语

行为经济学并非对经济理论的革命和颠覆，理性行动者模型也不应放弃。但是，经济学的确需要进行一些变革，以更好地理解人类行为“现象”，而不是将不符合标准理论的现象一概斥为“异象”。

十多年前，笔者在一篇讨论经济学方法论的文章(董志强, 2006, p.84)中指出，经济行为的考察可能有两种截然不同的动机：一种动机是按照某种规定性形式考察既定情况下人们应怎样合乎理性地行动，另一种动机是如何在纯粹理论中加入必要的元素以更好地解释和预测实际行为。这两种研究动机分别对应于标准的经济理论和描述性经济理论。标准经济理论的任务是在给定单一的自利偏好假设下对人类行为进行公理化的推导研究，描述性经济理论的目标则是试图结合更多的变量，对标准经济理论进行修正以解释和推测行为，甚至提出政策建议。今天，重申上述看法也是合适的。标准的理性行动者模型是理论基准，但更好地解释现象还需要加入情景依存偏好、人类在长期演化中获得的非物质动机等因素，即我们还需要描述性的理性行动者模型。

就在本文最后定稿之际，笔者在刚出版的《比较》杂志上读到2017年诺贝尔经济学奖得主塞勒一段话，于吾心戚戚，特录于此：“(经济)理论方面的基本问题是，我们总想用一个理论来完成两个不同的目标：描述最佳行为并预测实际行为。我们不应放弃第一类理论(理性经济人模型)，它们毕竟是任何经济分析的必要元素，但我们必须使用派生于数据而不是公理的其他描述性理论来扩充第一类理论。”(塞勒, 2017, p.88)

参考文献

[]	艾瑞里, 2012, 《不诚实的诚实真相》, 中信出版社.
[]	贝克尔, 1995, 《人类行为的经济分析》, 上海三联书店、上海人民出版社.
[]	董志强, 2006, “纯粹利己主义反思与经济学方法论的二重性”, 《学术月刊》, 第 8 期, 第 81–85 页。
[]	黄锦鹏、董志强, 2014, "偏好为什么应该是一致的: 演化视角的解释", 《中国社会科学报》, 2014-05-19, A07版.
[]	理查德·塞勒, 2017, “行为经济学的过去、现在和将来”, 《比较》, 第 6 期, 第 87–114 页。
[]	鲁宾斯坦, 2007, 《微观经济学讲义》, 上海人民出版社.
[]	平新乔, 2001, 《微观经济学十八讲》, 北京大学出版社.
[]	Ainslie, George and NickHaslam, 1992, "Hyperbolic Discounting", in Choice Over Time, edited by George Loewinstein and Jon Elster, New York:Russell Sage.
[]	Ainslie , George and Rechard J. Herrnstein, 1981, "Preference Reversal and Delayed Reinforcement". Animal Learning Behavior, 9(4), 476–482. DOI:10.3758/BF03209777
[]	Alcock, John, 1993, Animal Behavior:An Evolutionary Approach, Sunderland, MA:Sinauer Associates.
[]	Benzion , Uri , Amnon Rapoport and Joseph Yagil, 1989, "Discount Rates Inferred from Decisions:An Experimental Study". Management Science, 35, 270–284. DOI:10.1287/mnsc.35.3.270
[]	Böhm-Bawerk, Eugen von, (1889)1970, Capital and Interest, South Holland.
[]	Bowles, Samuel, 2004, Microeconomics:behavior, institutions, and evolution. Princeton University Press.
[]	Chapman G. B., 2000, "Preferences for Improving and Decling Sequences of Health Outcomes". Journal of Behaviral Decision Making, 13, 203–218. DOI:10.1002/(ISSN)1099-0771
[]	Chapman G. B., 1996, "Temporal Discounting and Utility for Health and Money". Journal of Experimental Psychology:Learning, Memory, Cognition, 22(3), 771–791. DOI:10.1037/0278-7393.22.3.771
[]	Frederick, Shane and Geoge Loewinstein, 2002, The Psychology of Sequence Preferences, Working Paper, Sloan School, MIT.
[]	Gintis, H., 2009, The Bounds of Reason:Game Theory and the Unification of the Behavioral Sciences, Princeton University Press.
[]	Green , Leonard , Nathanael Fristoe and Joel Myerson, 1994, "Temporal Discounting and Preference Reversals in Choice Between Delayed Outcomes". Psychonomic Buletin and Review, 1(3), 383–389. DOI:10.3758/BF03213979
[]	Kagel, John H. and Alvin E. Roth, 1995, Handbook of Experimental Economics, Princeton, NJ; Princeton University Press.
[]	Kirby , Kris N. and Richard J. Herrnstein, 1995, "Preference Reversals Due to Myopic Discounting of Delayed Reward". Psychological Science, 6(2), 83–89. DOI:10.1111/j.1467-9280.1995.tb00311.x
[]	Koopmans T. C., 1960, "Stationary Ordinal Utility and Impatience". Econometrica, 28, 287–309. DOI:10.2307/1907722
[]	Loewinstein , George E. and Drazen Prelec, 1993, "Preferences for Sequences of Outcomes". Psychological Review, 100(1), 91–108. DOI:10.1037/0033-295X.100.1.91
[]	Loewinstein , George E., 1987, "Anticipation and the Valuation of Delayed Consumption". Economy Journal, 97, 666–684.
[]	Loewinstein , George E., 1988, "Frames of Mind in Intertemporal Choice". Management Science, 34, 200–214. DOI:10.1287/mnsc.34.2.200
[]	Mas-Colell A., Whinston M. D. and Green J. R., 1995, "Microeconomic Theory.", New York: Oxford University Press.
[]	Pender , John L., 1996, "Discount Rate and Credit Markets:Theory and Evidence from Rural India". Journal of Developmental Economy, 50(2), 257–296. DOI:10.1016/S0304-3878(96)00400-2
[]	Rae, John, 1834, The sociological theory of capital, London:Macmillan.
[]	Real , Leslie A., 1991, "Animal Choice Behavior and the Evolution of Congnitive Architecture". Science, 253(30), 980–986.
[]	Redelmeier , Daniel A. and Daniel N. Heller, 1993, "Time Preference in Medical Dcision Making and Cost-effectiveness Analysis". Medical Decision Making, 13(3), 212–217. DOI:10.1177/0272989X9301300306
[]	Robson, A. J., 1995, "A Biological Basis for Expected and Non-Expected Utility", Department of Economics, University of Western Ontario.
[]	Samuelson , Paul , 1937, "A Note on Measurement of Utility". Review of Economic Studies, 4, 155–161. DOI:10.2307/2967612
[]	Sen, A., 2008, "Rational Behaviour", in The New Palgrave Dictionary of Economics (Second Edition), Eds. Steven N. Durlauf and Lawrence E. Blume. Palgrave Macmillan.
[]	Shelley M. K., 1993, "Outcome Signs, Question Frames and Discount Rates". Management Science, 39, 806–815. DOI:10.1287/mnsc.39.7.806
[]	Simon, H., 1982, Selections of Simon, The MIT Press.
[]	Solnick , Jaym Catherine Kannenberg, David Eckerman and Marcus Waller, 1980, "An Experimental Analysis of Impulse Control in Humans". Learning and Motivation, 11, 61–77. DOI:10.1016/0023-9690(80)90021-1
[]	Thaler , Richard H., 1981, "Some Empirical Evidence on Dynamic Inconsistency". Economic Letters, 8, 201–207. DOI:10.1016/0165-1765(81)90067-7
[]	Varey , Carol A. and Daniel Kahneman, 1992, "Experinces Extended Across Time:Evaluation of Moments and Episodes". Journal of Behavioral Decision Making, 5(3), 169–185. DOI:10.1002/(ISSN)1099-0771
[]	Wilkinson, Nick, 2008, An Introduction to Behavioral Economics, Palgrave Macmillan.
[]	Zambrano , Eduardo , 2005, "Testable Implications of Subjective Expected Utility Theory". Games and Economics Behavior, 53(2), 262–268. DOI:10.1016/j.geb.2004.09.011

返回顶部