博士研究生选拔“申请—考核”制是近年研究生考试招生制度改革的热点内容,其要点在于以提高人才选拔质量为目标,注重对学生专业素养、研究能力和创新潜质的综合评价,在实现途径上,要切实“发挥专家组审核作用。”[1]
怎样才能通过研究生招考制度安排使专家组考核作用得到充分发挥?这既是“申请-考核”改革制度设计的重点,也是实现改革目标的关键因素之一。该问题同样存在于硕士研究生复试管理环节,是提高测试选拔质量的关键。当前的实践探讨和理论研究较多地集中在“申请-考核”制度的理论分析①和考核过程中测试双方互动因素对测试效度的影响②等方面,对考核主体在考核过程中的行为选择分析相对较少③。在具体实践中,出于对申请人或考生科研素质全面考评的需要,通常会将综合考核的一些环节设置为面试形式,而“面试是面试官通过对应聘者的观察,对其能力或特质做出评价的活动过程。面试官个人的情绪与认知共同指导决策行为,面试官小组的团体情绪也会对最终评分决策造成影响。”[2]在主观因素相对较多的综合考核过程中,“最大的风险来自于招考过程中的人性弱点”,因为“个体难免会因为个人利害关系的考量而在行为选择方面有非理性的表现。”[3]行为主体特别是测试专家的行为选择将直接决定测试结果,进而对人才选拔质量产生影响。本文以博弈论为分析工具,对不同结构的专家组中测试专家的行为选择进行初步探讨,以期对博士研究生“申请-考核”制改革及硕士研究生复试管理等工作有所启发。
一、 猎鹿博弈(Stag Hunt Game, SHG):专家组考核的逻辑目标考虑最基本的情况:有二位专家A和专家B,每位专家如果单独进行测试而不是合作以专家组的形式进行测试,也可以得到考核结果并选拔出考生。若合作进行测试,则考核结果更加有效、选拔质量更高。假设专家单独测试考核可以获得3个单位的收益,合作考核的收益为5。但如果一个专家选择合作测试时另一个专家却选择了单独测试,则单独测试的专家仍然可以获得3单位的收益,选择合作测试的专家由于承担了效率损失,相对收益减少到1。将每位专家的行为选择和收益写成矩阵形式,每个单元格内,左侧为专家A的收益,右侧为专家B的收益,A和B的收益是对称的(稍后将放松这一条件),见矩阵(1)(见表 1)。
可以发现,如果专家A选择合作测试,这时候专家B最好的选择是合作(因为5>3);而专家A选择单独测试时,专家B最好的选择是单独测试(3>1)。反过来,如果专家B选择合作,专家A的最优选择也是合作;专家B选择单独测试,专家A的选择也是单独测试而不是合作测试。即博弈矩阵(1) 存在两个纳什均衡:(合作,合作)和(单独,单独),专家A和B的收益组合分别为(5, 5) 和(3, 3)。相应地,专家组(A和B)的总体收益为10和6。显然(合作,合作)是一个帕累托最优结果,这种情况下专家组的整体收益最大。
矩阵(1) 所反映的基本模型就是专家组测试的逻辑内涵和组织目标。一般认为,采取多人组成测试小组进行考核将增加评价的信度和效度[4]。从对选拔标准的理解和把握来看,测试专家之间的交流和讨论可以帮助他们对与测试目标不相关信息的认识更加清晰[5],即在选拔目标和选拔标准方面更加一致;从对考生素质和业务能力的全面衡量来看,专家组测试方式可以减少专家个人偏见的影响,综合多个角度的专家判断有助于提高结论的准确度[6];从评价结果的公平性来看,多人面试的分数结论将比单人的更可靠,综合多人的判断可以消除随机误差。[7]
二、 囚徒困境(prisoners’ Dilemma):专家组考核的结构风险考虑到专家组测试方式可以提高测试结果的质量,将专家A和B组成专家组开展测试工作。在专家组中,专家A和B同样面临具体的行为选择。相对于在测试活动中的实际贡献,矩阵(1) 所反映模型中专家的行为选择“合作测试”和“单独测试”,对应于“合作”(Contribute)与“不合作”(Don't Contribute)。“合作”表现为责任心强的专家以提高选拔质量为目标,认真地投入测试工作,履行专家职责,努力和充分地运用自身的学术识别力对考生的业务素养、创新能力和培养潜力进行考核评价,恪守公平原则,并且,作为专家组中一员,主动注重与其他专家的协调配合。反之,“不合作”则表现为有的专家责任心不强,不认真对待考核测试,应付工作,停留于表面,或者像独立进行考核一样我行我素,而不与其他专家配合,个别专家在考核期间从事与测试无关的工作,甚至出现寻租、腐败现象。
给定以专家组的形式进行测试,专家可以选择“合作”与“不合作”,若二者都合作,保证了考核质量,双方都可以得到5个单位的收益;双方若都不合作,等同于分别单独测试,但效率反而降低,各自获得2个单位收益;而在一方选择合作,另一方不合作时,不合作的一方占有了另一方的劳动成果,由于“不劳而获”,总收益为6,相应地选择合作的一方所付出的劳动被占有,还不如不合作,收益为0。得到矩阵(2)(见表 2)。
可以发现,若专家A选择合作,专家B的最优选择是不合作(6>5);若专家A选择不合作,专家B的最优选择仍是不合作(2>0)。那么,专家A知道专家B的最优选择将是不合作,若选择合作得到收益为0,不合作收益为2,于是也将不合作。矩阵(2) 的纳什均衡只有一个,即(不合作,不合作),双方的收益为(2, 2)。
显然,双方均合作从而得到总收益为10的结果仍是对专家组总体来说最好的状态,但实际出现的结果却是双方不合作。
不合作的行为将导致考核流于形式,起不到作用,直接影响到选拔质量。这种可能性不仅存在于理论分析,在实际的复试、考核工作中就可以观察到类似现象,如“明显的形式主义”“内容不够全面,评价标准单一”等,导致考核测试的“科学性、有效性难以保证”,“无法做到公平公正”等问题[8-9]。
矩阵(2) 的模型说明,专家组形式并不一定必然提高考核测试质量。关键在于组成专家组的各专家具体选取何种行为,而行为选择又受制于专家与专家之间实际状态,即测试活动中的“生产关系”。在某些专家组,内部各成员可能由于彼此间的观点分歧,或者测试以外的因素而影响测试结论[10]。一些专家在专家组内的行为会受到诸如权威成员、反对者等特殊个体的影响,当专家组中存在权威成员时,有的成员可能害怕自己判断失误,因而采取从众的策略[11]。一些实证研究也发现,在测试结果的某些方面,单独面试较集体面试的效度甚至要高[12]。
三、 分析与讨论上述分析可知,专家组考核的组织方式既可能出现“猎鹿博弈”,也可能导致“囚徒困境”。充分发挥专家组的考核作用,显然应尽量追求合作共赢的“猎鹿博弈”,而避免“囚徒困境”,后者反映在矩阵(2) 中,双方合作(CC)是对整体最优的结果,而博弈均衡却是双方不合作(DD)。
根据专家A和专家B的行为选择,将矩阵(1) 和矩阵(2) 写为一般形式的矩阵(3)。每个专家有二个选择:“合作(C)”与“不合作(D)”,若双方都选择合作时,总体结果最好,获得奖励R(Rewards),都不合作时,视为得到惩罚P(Punishment),都有不劳而获的诱惑T(Temptation),当自己合作而对方不合作即纯粹“做贡献”时的损失记为S(sucker)[13]。
条件一:T>R并且P>S,即对于任何一方来说,在对方合作时自己选择不合作将得到更多收益,并且对方不合作时自己不合作比合作更好。
条件二:R > P,R > S,即双方合作的收益(CC)大于双方不合作的收益(DD),也优于单方合作。
条件三:2R > T + S,即双方合作的总收益大于单方合作、单方不合作,并且保证了双方合作的选择(CC)是矩阵(3) 的次优选择。
综合以上特点得到:T>R>P>S.
相应地,“猎鹿博弈”则要求[16]:R>T>P>S.
由此可知,实现“猎鹿博弈”,即满足专家组测试目标的基本条件为:对于专家来说,合作的收益应大于不合作的收益,或者说,认真负责地进行考核测试要大于“坐享其成”的诱惑。
进一步地,要正确地把握“收益”的具体含义。专家参与测试考核活动既有收获,又有付出;既能得到一定效用,又要付出一定成本,获得效用与付出成本的差值即为实际产生的收益。理性的专家将权衡实际收益,并据此决定行为选择。对于专家来说,收益不仅包括货币形式的劳动报酬,更包括专家在学术活动中履行职责、获得荣誉的心理满足所产生的效用,以及对未来学术进步的预期等方面。相对而言,后者所产生的效用更大。因为相对于企业,学术活动的特殊性决定了在教育活动中更应注重间接激励,而不是直接物质激励的方式[17]。
因此,在专家组考核安排中应着眼于增加测试专家参与考核活动的收益,既要考虑提高专家所获效用,也要降低专家参与测试的成本;既要注重直接激励,更要注重间接激励。可采取的措施包括:对参加考核测试工作的专家发放劳务报酬、在可能的情况下提高标准;选取具有一定业务水平和能力的学者担任测试专家;注重专家组成员的互补性;倡导和营造学术合作环境;明确选拔标准、吸引优秀生源等方面。这样做的原因主要是基于不同类型的专家具有不同的效用和成本。
一般来说,高水平的专家更容易识别和判断学生的业务素养与能力,其测试成本相对比较低,但也不一定是越高水平的专家越好,因为越高水平的专家进行其他学术活动的效用同样越大,参与测试活动的机会成本反而增加,所以测试专家应该具有“一定”的业务水平和能力,体现在现行的实际政策上,如教育部《2014年招收攻读博士学位研究生工作管理办法》要求“招生单位应组织一般不少于五人的本学科副教授职称(含)或相当专业技术职务以上专家组成复试小组,对参加复试的考生进行学术水平考查。”[18]此外,作为导师的专家通过测试考核选拔出综合素质较高的学生进行指导,未来的指导成本相对素质不高的学生会较低,并且如果培养出优秀学生,作为导师的专家也将获得一定的学术荣誉。
与专家独自地考核学生不同,专家组考核方式是各位测试专家对考生进行评价形成整体结论,专家组的构成上还应注重专家的合作与互补。一方面,在较好的学术合作环境中专家之间更容易交流沟通达成合作状态,另一方面,高质量的考核测试活动中关于学术前沿、学术热点、具体学术问题的讨论对作为参与者的不同的考生和专家都将是有价值的学术信息,不同角度的同行专家既可以更加全面地评价学生的业务能力,也有助于专家个人丰富观点,也就是说,一位专家的努力如果也有助于其他专家的学术积累,那么,专家之间所具有的“互补性”能提高共同合作的价值,[19]专家组内部才更容易形成合作。
(二) 现实的对策措施:避免“囚徒困境”在营造氛围、采取措施诱导产生“猎鹿博弈”的同时,也要考虑对潜在的“囚徒困境”采取相应对策努力避免[20]。
上述分析可知,T>R是产生“囚徒困境”的基本原因,要实现R>T的目标,在增加专家的收益(R)的另一方面,可以考虑增加“不合作”的成本,即减少T.例如,将矩阵(3) 修改为矩阵(4)(见表 4)。
矩阵(4) 的含义是,对不合作行为进行一定的惩罚性处理(X),降低不合作行为的收益。例如,加强考核复试的巡查和巡查通报工作,强化信息公开,考核测试过程录音录像,严肃处理违纪违规问题等,其实质就是增加不合作的成本,或者说降低不合作行为的收益。
惩罚性的处理必须维持一定的力度,因为如果满足条件T-X>R>P-X>S,那么结果仍然会是“囚徒困境”,只有实现条件R>T-X,则矩阵(4) 的均衡将出现在(C, C)。也就是说,制度和政策的执行应严格。
此外,也要注重维持政策和环境的稳定性。考核测试活动一般不是一次性,而是经常性进行。在长期合作中,专家不仅要考虑眼前的收益,也要考虑长期的累积收益。如果专家对未来收益的贴现因子为δ(δ<1),即对未来收益当期价值的判断,显然,δ越大,专家越有耐心,认为未来的收益与当前的差别不大。那么,如果合作持续了n次,专家合作收益的当期贴现值为:
${\rm{V}} = {\rm{R}} + {\rm{\delta R}} + {{\rm{\delta }}^2}{\rm{R}} + \cdots \cdots {{\rm{\delta }}^{{\rm{n}} - 1}}{\rm{R}} = \frac{{1 - {{\rm{\delta }}^n}}}{{1 - {\rm{\delta }}}}{\rm{R}}$ |
由于δ<1,显然V>R,并且,总收益V将随着时期(n)的增加而增加,即政策、环境越稳定,越有助于提高专家由于未来预期因素的收益。如果某专家在第一次考核测试活动中采取不合作态度,即使T>R,获得了眼前利益,但是可能影响以后的合作收益,长远来看是得不偿失的。因此,维持较为稳定的组织结构是较为合适的选择,如果专家所在的招生单位比较稳定,有助于维持长期的合作关系,降低“囚徒困境”的风险。
(三) 专家组结构的其他情形不同行为选择所对应的收益还存在其他可能的关系,并且上述讨论均以专家收益对称为假设,现实中也可能出现非对称的情形,以下举例说明。
若T>R>S>P,即类似矩阵(5) 的形式,实际中可能出现的是“斗鸡博弈”(Chicken Game)[15]278。
这种情况下,若专家A选择了合作,专家B的最优选择是不合作,因为6>5;若专家A选择不合作,专家B的最优选择是合作,因为3>2,于是矩阵(5) 的纳什均衡有二个,即(合作,不合作)和(不合作,合作)。
出现这种结果可能的实际状况为,两位专家的互补性不强,测试考核任务实际上由一位专家即可以完成大部分,也就是说,实际上两位专家差不多,一位专家(例如A)即可差不多达到考核目标,另一位专家的加入对考核结果的贡献不大。
从效率角度看,矩阵(5) 所反映的状态并不是理想状态,这是因为虽然增加一位专家作用不大,但是仍然有一定的贡献,反映在两位专家都认真投入地进行考核,专家组总收益为10,但是只有一位认真负责时,总收益为9,说明存在一定的效率损失。若进一步调整其条件,使2R<T+S,成为矩阵(6)(见表 6)。这时,纳什均衡仍然是两个:(合作,不合作)与(不合作,合作)。但是这种情况下,一位专家努力时,专家组的总收益为14,大于一起努力的收益(10),总体上看是更有效率的结果,其关键条件在于2R<T+S,该条件实际上决定了,在这种情况下一方合作一方不合作是帕累托最优的结果。
与矩阵(5) 相比,矩阵(6) 所反映的状况是,两位专家基本上相同,任何一位专家均可以较好地完成考核任务。
矩阵(5) 和(6) 的区别在于,在矩阵(5) 所代表的状态下,从考核任务角度看,两位专家均可能发挥作用,专家组的形式仍然有其效果,但是总体效率有所损失;而在矩阵(6) 所代表的状态下,总体效率没有损失,但是实际上一位专家即可完成考核任务,可以不需要另一位加入,基本上可以不采取专家组形式。
矩阵(5) 和(6) 所代表的情况具有一个共同点,即两位专家均具有完成考核测试任务的能力。如果两位专家的其中一位基本具有完成考核任务的能力,另一位基本上不具备,那么将可能出现的是“智猪博弈”(Pigs Game),见矩阵(7)(见表 7)。
这种情况下,无论专家A如何选择,B的最优选择都是不合作,给定B的这一选择,如果A选择不合作,收益为2,选择合作的收益为5,因此最好的选择是合作,得到更大的收益,因此矩阵(7) 的纳什均衡是(合作,不合作)。可能的实际情形是,A是具有独自完成测试任务的专家,B则缺乏经验,基本不具备考核能力,在测试中甚至可能会帮倒忙。从A的个人角度来看,若不参加测试工作,从事其他方面的学术活动可能会得到更大的收益(6>5)。若A和B都认真开展工作,由于B的影响,专家组的总收益为7,反而不如专家B不那么认真,专家组的总收益将更大(达到9)。当然,如果两人都不认真,则总收益最低,考核目标无法达成。
注释:
① 如:张宇迪, 贾晓明, 王战军.我国博士招生“申请—考核制”的公平性制度设计[J].学位与研究生教育, 2016(3):48-51.杨震.基于申请-考核制的博士研究生招考改革[J].当代教育论坛, 2015(2):6-11.陈亮.公平正义诉求下的博士招生“申请—考核”制探微[J].现代教育管理, 2014(12): 107-111.
② 如:陈学军, 林志红.面试考官的权重策略对评分和录用的影响[J].应用心理学, 2009, 15(4):356-360.田效勋, 车宏生.面试预测效度和构想效度研究述评[J].心理科学进展, 2009, 17(4): 870-876.邓帅, 邢占军.面试考官评价的有效性探讨[J].东岳论丛, 2015, 36(3):21-24.
③ 如:罗英姿, 刘泽文, 张佳乐, 等.博士生招生“申请-考核”制下的行为选择与制度安排[J].教育发展研究, 2016(5):58-64.
[1] | 教育部、国家发展改革委、财政部《关于深化研究生教育改革的意见》(教研[2013] 1号). |
[2] | 徐建平, 周瀚, 李文雅, 等. 结构化面试中面试官的评分及影响因素[J]. 心理科学进展, 2014, 22(2): 357–368. |
[3] | 牛国卫, 班建武. 我国博士生招生申请考核制的SWOT分析[J]. 研究生教育研究, 2013(4): 58–61. |
[4] | Macan T. The Employment Interview:A Review of Current Studies and Directions for Future Research[J]. Human Resource Management Review, 2009, 19(3): 203–218. DOI:10.1016/j.hrmr.2009.03.006 |
[5] | Richard D. Arvey, James E. Campion. The Employment Interview:A Summary and Review of Recent Research[J]. Personnel Psychology, 2010, 35(2): 281–322. |
[6] | Campion M A, Palmer D K, Campion J E. A Review of Structure in the Selection Interview[J]. Personnel Psychology, 1997, 50(3): 655–702. DOI:10.1111/peps.1997.50.issue-3 |
[7] | Dipboye R L, Gaugler B B, Hayes T L, et al. The Validity of Unstructured Panel Interviews:More Than Meets the Eye?[J]. Journal of Business and Psychology, 2001, 16(1): 35–49. DOI:10.1023/A:1007883620663 |
[8] | 陆静. 研究生复试中存在的问题及对策研究[J]. 当代教研论丛, 2016(2): 25–26. |
[9] | 朱彩虹, 贾超, 邵岩, 等. 全日制硕士研究生复试现存问题研究及对策[J]. 河北工业大学学报(社会科学版), 2015, 7(4): 24–27. |
[10] | Bozionelos N. When the Inferior Candidate Is Offered the Job:The Selection Interview as a Political and Power Game[J]. Human Relations, 2005, 58(12): 1605–1631. DOI:10.1177/0018726705061437 |
[11] | Franken I H A, Muris P. Individual Differences in Decision-making[J]. Personality & Individual Differences, 2005, 39(5): 991–998. |
[12] | Mcdaniel M A, Whetzel D L, Schmidt F L, et al. The Validity of Employment Interviews:A Comprehensive Review and Meta-analysis[J]. Journal of Applied Psychology, 1994, 79(4): 599–616. DOI:10.1037/0021-9010.79.4.599 |
[13] | Anatol Rapoport, Albert M. Chammah. Prisoner's Dilemma[M]. The University of Michigan Press, 1965: 33-34. |
[14] | Macy M W, Flache A. Learning Dynamics in Social Dilemmas[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(Suppl 3): 7229–7236. |
[15] | Frohlich N, Oppenheimer J. When Is Universal Contribution Best for the Group? Characterizing Optimality in the Prisoners' Dilemma[J]. Journal of Conflict Resolution, 1996, 40(3): 502–516. DOI:10.1177/0022002796040003006 |
[16] | Grim P, Au R, Louie N, et al. A Graphic Measure for Game-Theoretic Robustness[J]. Synthese, 2008, 163(2): 273–297. DOI:10.1007/s11229-007-9212-7 |
[17] | Ballou D. Pay for Performance in Public and Private Schools[J]. Economics of Education Review, 2001, 20(1): 51–61. DOI:10.1016/S0272-7757(99)00060-6 |
[18] | 教育部. 2014年招收攻读博士学位研究生工作管理办法[OL]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s3114/201404/167125.html |
[19] | 乔尔·沃森. 策略: 博弈论导论[M]. 费方域, 赖丹馨, 等. 上海: 格致出版社, 2010: 68-74. |
[20] | 张维迎. 博弈与社会[M]. 北京: 北京大学出版社, 2013: 41, 130-138. |