文章快速检索     高级检索
  科学与社会  2017, Vol. 7 Issue (1): 31-40  
0

引用本文 

王飞. 德国科学委员会对科研成果评价及科研诚信关系的分析与建议[J]. 科学与社会, 2017, 7(1): 31-40.
WANG Fei. Revelations from German Scientific Committee's Analysis and Suggestion to the Relation between Scientific Achievements Assessment and Research Integrity[J]. Science and Society, 2017, 7(1): 31-40. DOI: 10.19524/j.cnki.10-1009/g3.2017.01.031.

基金项目

教育部人文社会科学研究青年项目(14YJC720026)

作者简介

王飞, 大连理工大学马克思主义学院副教授。研究方向为科学技术哲学、科学技术伦理、马克思主义基本原理研究

德国科学委员会对科研成果评价及科研诚信关系的分析与建议
王飞     
大连理工大学马克思主义学院
摘要: 德国科学委员会非常重视科研成果评价程序的建设。它认为科研成果评价直接影响到科学实践,要形成良好的科学实践,减少科研不端事件的发生就必须有一个合理的、高效的科研成果评价程序的引导。在《科研成果评价与监督的建议》中,德国科学委员会从宏观和微观两个层面对科研成果评价与科研诚信关系进行了分析,指出了科研成果评价各个方法隐含的可能导致的科研不端,并就此提出了补充与改进建议。这些分析和建议虽然是针对德国科研成果评价体系的现状和出现的问题提出的,但是对我国科研评价体制的建立具有一定的启示。
关键词: 科研成果评价    科研诚信    科研不端    德国科学委员会    

德国科学委员会非常重视科研成果评价程序的建设。它认为科研成果评价直接影响到科学实践,要开展良好的科学实践,减少科研不端事件的发生就必须有一个合理的、高效的科研成果评价程序的引导。德国科学委员会在《科研成果评价与监督的建议》(Empfehlungen zur Bewertung und Steuerung von Forschung Sleistung) 的发布公告上表示,“科研成果评价必须服务于维护并强化良好的科研”[1]

德国科学委员会从上世纪80年代就着手建立科研成果评价程序[2],并试图通过评估、晋升程序、研究排名以及卓越创新方法形成一个科学的评估体系。90年代通过重大改进后,科研成果评价程序变得更透明、更具有可操作性。改进前只有业内的专业团体才知道评价程序,改进后业外人士也可以了解评价程序的相关内容。近几年,德国科学界对科研成果评价程序的争议越来越激烈,为此德国科学委员会于2010年成立了专门的工作组,着手对已有的科研成果评价程序本身进行全面的分析考察,对其实施的效果进行评估,找出其对形成良好的科学实践的贡献和不足之处。德国科学委员会对考察结果进行的分析评价,以及针对不足之处提出的改进建议,体现在2011年公布的《科研成果评价与监督的建议》(以下简称《建议》) 中。

一、 科研成果评价与科研诚信关系的宏观分析

在《建议》中,德国科学委员会专门用一小节分析了科研成果评价与科研诚信的关系。文件认为,建立科研成果评价程序的目标在于倡导良好的科研 (即科研诚信)。“科研成果的评价程序本身是没有价值的,它的价值在于使良好的科研成为可能,并使之强化。” [3]11

为此,《建议》首先就诚信科研的原则进行了概括,主要包括四个方面:(1) 科研实践的首要任务是求真,好奇与探索未知的问题,以追求新发现为指导原则。(2) 科学实践的标志性特征是通过成果的原创性体现出良好科研的重要性,要求对假设、理论、方法、数据进行质疑,并重新检验它的意义。(3) 科研成果的可重复性。(4) 诚信对于良好的科研实践产生的重要意义。良好的科研实践既不接受欺骗,也不容忍疏忽。科学工作者除了要遵守学科内的理论与方法标准,还要遵守科研伦理,特别是良好的科学实践规范。

《建议》分析了保证科研诚信的前提。认为科学需要一个有工作能力和批判能力的共同体,并保证良好科研的环境。具体包括如下几个方面:(1) 科研诚信必须通过研究者的工作环境、日常工作的自由空间、机遇、自己的工作模式与时间模式得到支持。(2) 科研诚信必须通过制定的框架条例体现出来:通过研究所自治,保障每个参与者行为的可期待性;通过制订法律条例,保障研究成果的出版和使用;通过经费资助,支持基本需求、风险性的研究和认识实践的多样性。(3) 对基础研究、应用研究与服务性研究进行正确的划界,不应把它们划分为价值不同的科学领域,而应当描述为不能严格分开的科学实践。(4) 科研实践的理论和方法必须是可靠的,错误的前提、结果、步骤和科研实践活动都应当受到批判和纠正。最后,《建议》还提出了对科研活动的更高期望:(1) 要科学自治但不能自我封闭;(2) 科研体系应具备创新、咨询与解决问题的能力;(3) 科研成果评价体系要注意鼓励教学活动。

二、 科研成果评价与科研诚信关系的微观分析

除了上述在宏观层面对科研成果评价与科研诚信关系进行分析外,德国科学委员会还对两者的关系进行了微观研究。德国科学委员会对科研成果评价体系中的具体要素进行了逐一分析,指出了其对科研诚信建设的有利与不利方面。

同行评议。德国科学委员会首先肯定了同行评议是科研成果评价体系中质量导向的必要手段,在论文鉴定、项目申请、晋升程序、机构评估、甚至在教学工作中都经常使用。但是同行评议因花费太高也有负面效果:数据的提取缺乏标准化;在机构层面上的缺陷是采用的参数较少、节奏过快;在个人层面上的不足是超负荷鉴定;评估程序不能做出表决;排名数据的提取有待商榷;对科学研究的提问不足;内部、外部报告体系的要求不同;内部缺乏确保质量的措施;此外,还存在同行之间的冲突,以及可能导致均质化,形成不利于创新的判断,做出的判断以研究所与个人的声誉为依据;优先选择切合自己的题目和方法,容易诱发马太效应的产生。

数量指标。经常使用的数量指标,简单的有:获得第三方资助量、博士生数量、出版物数量、引用数量;复杂的有:文献计量法指标,如与专业平均引用率相比较的引用率或H指数;此外还有专利数量、硕士生数量、奖励数量、报告数量、对组织大会的贡献等。数量指标的优点是可简化复杂性,具有可比较性。但是缺点也是比较明显的:由于过度重视数量而导致质量丧失;成果水平的提升达到学科的上限,导致饱和效应;第三方资助的费用超过研究的效益;博士生数量达到规定的限度后不能再增加;出于经济利益的考虑而尽量多地出版;因为重视引用率和影响因子,忽略了知识与研究成果的传播,优先考虑满足成果评价的标准。

评估。评估对象原则上针对的是项目、研究团队或整个研究所,评估既可以是事前评估也可以是事后评估。评估程序产生的副作用与同行评议类似:首先是昂贵的支出和需要表决;此外,有学者批评,不是所有程序都是有结果的,对部分高校而言评估只是一种纯粹的形式,高校中的研究部门和教师席位不必为缺乏成果担心被撤销。

排名。德国自上世纪80年代开始形成不同的排名方法,2004年德国科学委员会提出了对排名的建议,并在许多专业进行了试验性测试。科学委员会的排名办法是同行根据数量和质量指标来排序,不采用国际上有影响力的世界大学排名 (例如上海交通大学的排名)。评价的方法多样化,根据多个指标得出综合排名。排名是根据发表的成果之间的差异形成对研究所或个人比较的基础,为判断其在国内外所处的地位提供依据;排名充分发挥了竞争的作用,影响整个国家、高校与个人的发展。其负面作用是:排名的结果不总是能体现差异,易对国家与国际竞争能力形成草率地判断;排名往往借助于数量指标,研究的内容和质量因对排名地位的关注而容易受到抑制。

地方资助。德国大多数州自上世纪90年代以来引入了成果导向的资助分配程序。引入这一程序的目的是消除高校不断增长的资助的偶然性;资助分配依赖于明确的标准与科学政策确定的目标;根据研究、教学的不同成果和责任给予不同的荣誉;得出不同于州参数的报告;适当地应对拮据的资金状况。然而近几年采用的成果导向的资助分配程序本身依然存在弊端:引发署名作者之间的冲突;弱势学科、弱势研究可能被忽视;发表的文章短小化。

科研不端行为是多种多样的,不仅仅表现为剽窃、数据伪造等,而且常常表现为方法不当、钻规范的空子、忽视创新的源头、不合法的署名、忽视引用规范、引用没有阅读的文献、谄媚性地引用可能的评议人的文献等。这些科研成果评价程序加剧了时间与竞争压力,激发了科研不端行为的产生;此外国际科学领域不断增长的竞争压力、国内外不断增长的研究数量,使科学工作者为了荣誉与就业机会而处于竞争之中,是诱发科研不端行为的另一原因。

三、 德国科学委员会改进科研成果评价程序的建议

针对德国现有的科研评价体系中存在的问题,德国科学委员会对改进科研成果评价程序提出了总建议和具体建议:

总建议:

(1) 自我反省。科学组织必须支配机构的机制 (如汇报制度与评分程序),必须具有及时准确地掌握信息的能力与提供咨询的能力,对外汇报、公布研究成果的能力以及制订内部战略、决策、学习与继续发展的能力。

(2) 程序检查。有规律地检查程序及其有效性,减少明显的错误或目标的偏离。

(3) 限制支出。减少负担,限制支出。保证数据的提取标准化,不同的程序的协调使用。

(4) 节奏适当。研究过程的不可计划性与有规律地汇报与计划性之间的平衡可以通过评价过程的减速或适当的节奏来实现。

(5) 避免“吨位意识”。研究成果评价可能导致数量的增加,因此在评价程序中首先要强调研究成果的质量。

(6) 适合的程序。科研成果评价程序的开发应当考虑到不同高校与不同研究机构的使命。机构的 (主要) 任务除了研究,还有教学、服务与咨询等。

(7) 所有层次的参与者的沟通。科研成果评价程序的开发要便于所有层次的参与者之间的交流。

(8) 财务条件。高校与研究机构的基本资金必须满足研究、教学、青年人才的培养,以及服务 (依赖于主要任务) 的核心任务。

(9) 保证吸引力。科研成果的监督体系应当使青年科学工作者受益,高校与研究机构应提供有吸引力的发展前景与工作条件。

(10) 考虑教学。建立以平衡教学与研究为目标的教学与监督机制。

(11) 多样化的监督途径。科研监督应尽可能地提供专业化的手段而不是首先使用金钱激励与数量计量。

具体建议:

(1) 采用相互补充的评价办法。为了避免简单的特别是以金钱激励带来的意外结果,德国科学委员会建议采用多样化的评价与监督办法。首先应确保科学工作者个体的自治与弹性工作时间,这一点常常被忽视。应当根据科学工作者的职业阶段与个体需求采取适当地自治,这样科学工作者才有可能在弹性时间确定工作重点,并为之负责。其次,要重视教学工作,建议设立与自由研究学期相似的自由教学学期。第三,晋升标准要考虑到多样性与角色的切合,采取不同的评价维度:研究、教学或成果的转化。第四,质量导向的成果评价工具是最有意义的,较少的或单一的数量指标是不可行的。第五,以声望为基础的评价也是有问题的。排名适合于机构层面,对个人层面来说不是很合适:因为有资历的科学工作者声望往往较高,这对青年科学工作人员不利。第六,科研不端与不足应当首先由科学共同体制裁;科研资助机构也应当给予适当的制裁;评价程序的有效性应服务于良好的科学实践。

(2) 同行评议。同行评议是科研成果评价中质量导向的必要手段,与高支出、高质量等资源紧密相关。由于同行评议不能排除自身产生的弊端。因此要对评议程序进行反思,确保评价质量。评议过程要遵守规范、保证评价成果的可靠性与有效性;专家的选择,应尽可能保障专家的多样性和国际化、有一定数量的青年科学工作者参与;专家组应充分掌握足够的信息。

(3) 科研成果指标。数量指标如第三方资助与文献计量学对科研成果的评价具有一定的作用。但应尽量减少数量指标应用的范围,数量指标仅仅作为质量信息与主观判断的补充时才有意义。在个体层面,特别是对于职称晋升,质量信息 (著作、论文、研究与教学成果、科学与技术转化、为研究提供的服务) 与内容观点才是最重要的,应当排除以数量指标为基础的评价,充分考虑科学工作者的年龄阶段与职业等级特点。

经常使用的指标有:文献计量学指标;第三方资助额度;第三方资助项目质量和数量;博士生数量/教授数量;科研奖励、特殊贡献、主题报告、大会报告;专利数量与专利价值;专利的应用。对于以上常用指标的使用,文件建议:对科研成果的界定应采用广义的成果概念;降低数量指标,如资助额度、博士生数量;支持专家鉴定、匿名评审;对个体的评价要采用质量导向的程序,而不是数量导向的程序。

(4) 评估活动。建议对高校与科研机构的评估频率为5-10年一次,避免随机评估;评估程序的表决环节要改进;以记过作为监督的手段,对意识到或没意识到的评估结果进行定期审查;对不同的对象采取不同的评价程序,保障程序的透明与参与度。

(5) 排名。排名要由不同专业的协会组织专家开展同行评议,专家应掌握充足的信息,采用多维度的、全面的成果指标、方法标准,数据要公开。

(6) 地方资助。进行良性的持续的基本资助;查明配置要求,根据高校的核心任务、需要开展资助;从以指标为基础的资助转向公开、可实施的方向发展,避免“马太效应”;查明研究项目的实际支出;战略资助即要有州层面也要有校内层面的;高校内部形成发放酬金的机制,对个体的评价放弃纯数量指标的使用;竞争性成果激励资助的多样化。

(7) 研究成果的保留。注重数据提取的标准的一致性与已有的和正在建设的评估体系的和谐;科学管理旨在服务,通过管理为科学家个体在数据提供、准备等方面减压。

四、 启示

如何遏制科研不端现象近几年已经成为一个世界性的难题,世界各国政府、学界从社会、伦理、心理、政策、管理等各个层面探讨科研不端形成的原因。由于各自关注的重点不同、依据的理论基础不同、所处的内外部环境 (社会、科研机构、大学) 不同,得出的结论自然也各不相同。但是基本达成共识的是,科研评价体系与科研不端之间存在一种较为密切的联系,一个良好的科研评价体系会压制科研不端,维护科研诚信,持续地激发科研创新能力;而一个不当的科研评价体系会诱发科研不端行为的产生,打击科研诚信,挫伤科研创新能力。德国科学委员会对这一问题有非常深刻的认识,它积极组织专家进行专门的调查、分析与论证,在此基础上提出有针对性的宏观与微观建议。虽然这些建议是针对德国的科研现状提出来的,与我国的科研状况之间存在着不少的差异,但有不少好的建议是值得我们学习与借鉴的。

1.针对不同高校与科研机构的“使命”制订相应的科研成果评价程序。

不同的高校与科研机构的“使命”或者说发展定位是不同的。在高校系统,有的高校定位是研究型、有的是教学型;研究型大学对单位职工的业绩考核以科学研究为主是大多数国家的共同做法;但是以教学为主的高校,不以教学为主而以研究为主就是舍本逐末。德国科学委员会在上述总建议的第6条和具体建议中的第1条,都指出务必要采用多样化的评价程序,在总建议的第10条和具体建议中的第1条,更是明确指出要重视教学,甚至建议设立与自由研究学期相似的自由教学学期。对科研成果的考核还要考虑科研的定位:是以基础研究为主,以应用研究为主,还是以综合研究为主。不同的科研定位也要采取相应的科研成果评价程序。如德国马普学会是一个以基础研究为主的研究机构,评价标准是研究的质量与水平,研究论文的数量与水平成为其重要的评价指标;弗朗霍夫学会是一个应用开发型研究机构,外部经费的数量与构成、客户的满意度等成为非常重要的指标,出版物则一般不纳入评价指标;赫尔姆霍兹协会属于大科学装置的研究机构,经费投入大,项目的规划与管理就成为重要的指标。我国大多数高校和科研机构采用的科研评价程序单一,盲目崇拜论文数量,对科研人员造成了错误的指向,严重加大了科研人员的额外负担,增强了不必要的竞争压力,也为科研不端埋下巨大隐患[4]

2.降低科研资助指标的权重,完善数量指标。

数量指标由于其客观性、简单性、易操作性和可比较性,自创立以来在各国得到广泛应用,德国也不例外。特别是科研资助指标 (第三方资助) 多年来一直被德国科学界看作科研成果评价程序的重要指标 (这与德国联合会的资助、管理与政策导向有重大关系),近几年来这一做法在德国引起了很大的争议。科研资助体系本身内隐的诱发科研不端的可能越来越受到关注,[5]据Rene Krempkow, Uta Landrock的调查,主要包括:(1) 引发更多的署名作者之间的冲突;(2) 强化主流研究;(3) 促使发表的文章短小。[6]德国科学委员会多次强调数量指标 (特别是科研资助指标) 主要应用于对组织机构的基本情况的了解,不适用于个人。对个人研究成果的评价应采用质量主导的评价程序,数量指标只能作为质量指标 (同行评议为主) 的辅助手段才有意义。近年来,我国学者在申请课题中出现的科研不端现象十分突出,“跑部钱进”、“关系评审”等学术腐败现象更是影响恶劣,这些现象的发生严重影响了学术、学风建设,催生了科研不端现象。

3.完善同行评议程序。

同行评议是科研成果评价中质量导向的科研评价的必要手段,但是同行评议的主观性较强,必须要有客观指标作补充。德国科学委员会反复强调,评审专家必须掌握足够信息,这些信息包括评价的步骤、原则、程序、规范等,最重要的对被评价对象信息地全面掌握,这需要一定的数量指标的补充。另外就是专家的遴选。由于专家的素质、能力和品格对评价结果有直接的影响,所以德国科学委员会特别强调专家选择的重要性,要求尽可能保障专家的无冲突性和多样性:背景的多样性、国际化、年轻化。同行评议的国际化和年轻化是引导和激励科研人员勇攀世界科技前沿的重要途径。世界主要科技强国都十分重视。德国三大科研机构马普学会、赫尔姆赫兹协会与莱布尼茨学会的国际专家分别达到60%、50%与1/3以上。美国国家科学基金会规定评议人的遴选要考虑评议人的种族、性别和年龄结构,还要每年分析评估评议人的机构、性别、民族等分布结构。[7]与之相比,我国同行评议专家的多样性、国际化和年轻化是一个亟待探讨和解决的任务。

Revelations from German Scientific Committee's Analysis and Suggestion to the Relation between Scientific Achievements Assessment and Research Integrity
WANG Fei     
School of Marxism Studies, Dalian University of Technology
Abstract: German scientific committee pays great attention to the construction of routines for scientific achievements assessment. It believes that routines for scientific achievements assessment have a strong impact on scientific practice, and in order for good scientific practice, a rational and effective routine for scientific achievements assessment must be constructed. In "Suggestion for Scientific Achievements Assessment and Supervision", it analyzed the relation between scientific achievements assessment and research integrity, and gave suggestions for perfecting scientific achievements assessment on both micro and macro level. These suggestions are beneficial for constructing our scientific achievements assessment.
Key words: scientific achievements assessment    research integrity    research misconduct    German Scientific Committee    
参考文献
[1] Wissenschaftsrat. Bewertung und Steuerung von Forschungsleistung kein Selbstzweck[EB/OL]. Berlin, 2011-11-14. http://www.wissenschaftsrat.de.
[2] Wissenschaftsrat. Empfehlungen zu Bewertung und Steuerung von Forschungsleistung. Halle, 2011.
[3] Wissenschaftsrat.Empfehlungen zu Forschungsberichterstattung der Hochschulen, in Wissenschaftsrat:Empfehlungen und Stellungnamen 1980, Koeln 1980, S.39-45;Wissenschaftsrat:Empfehlungen zum Wettwerb im deutschen Hochschulsystem, Koeln. 1985.
[4] 吴月辉, 刘诗瑶. 是激发科研人员创新动力, 还是把科研引入歧途: 评价"唯论文", 危害有多大. 人民日报, 2016-9-9(19).
[5] Dorothea Jansen, Andreas Wald, Karola Franke, Ulrich Schmoch, Torben Schubert. Drittmittel als Performanzindikator der Wissenschaftlichen Forschung. Zum Einfluss von Rahmenbedingungen auf Forschungsleistung. Koelner Zeitschrift fuer Soziologie und Sozialpsychologie, Jg.59, Heft 1, 2007, S.125-149.
[6] Rene Krempkow, Uta Landrock. Welche Effekte hat die LOM? Das Beispiel der Deutschen Universitaetsmedizin, in:Stefan Hornbostel.Governance der Wissenschaft, 2012.84.
[7] 龚旭. 中美同行评议公正性政策比较研究. 科研管理, 2005, 26(3): 1-7.