中国科技期刊研究  2015, Vol. 26 Issue (12): 1295-1300   PDF    
期刊质量权重在细化影响因子计算公式中的应用与探讨
林晓     
福州大学学报(自然科学版)编辑部, 福建省福州市大学新区学园路2号 350116
摘要[目的]细化期刊影响因子计算公式,研究了考虑引用期刊学术质量的影响因子计算公式。[方法]在计算期刊影响因子时细化期刊质量权重的计算方式,采用以(当年)期刊影响因子占所有期刊影响因子的比重作为期刊质量权重的计算方法的修正。并在原有的数据基础上,进行统计模拟计算和数据分析。[结果]采用细化期刊质量权重的影响因子计算结果较为精确。[结论]细化期刊质量权重计算方式将得到了比以往更为合理的影响因子计算公式,为期刊评价体系提供有益的参考。
关键词影响因子    细化    质量权重    
Application and discussion of weights of journal quality in the calculation formula of impact factor
LIN Xiao     
Editorial Department of Journal of Fuzhou University(Natural Science Edition), 2 Xueyuan Road, University Town, Fuzhou, Fujian 350116, China
Abstract: [Purposes] In order to refine the calculation formula of impact factor, the impact factor formula which considered the quality of citations was studied.[Methods] When calculating the impact factors, weshall refine the calculation of the weights of journal quality. We suggest that the weights calculation shall take the proportion of the impact factors for journals (that very year) as references to proceed modification. Based on the original data, we proceeded calculation of statistical simulation and data analysis.[Findings] The result of the calculation formula of the impact factor is more accurate by refining the calculation of the weights of journal quality.[Conclusions] More reasonable impact factors are obtained through refining the calculation of the weights of the journal quality, and it may provide a positive reference for the journal evaluation system.
Key words: Impact factor    Refine    Weight    

一直以来,各种期刊评价指标层出不穷诸如:影响因子、自引率(他引率)、期刊被引半衰期、数据库收录、基金论文比、平均作者数、文章发表数量以及近几年流行的h指数。但是国内大量期刊评价的研究是围绕影响因子这一指标展开的。"影响因子(Impact Factor,IF)是美国ISI(科学信息研究所)的JCR(期刊引证报告)中的一项数据。即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数"[1],这是一个国际上通行的期刊评价指标。这种经典的影响因子计算公式能体现期刊大体的被引情况,在影响因子相差不大的情况下能对论文质量进行有效的区分。但随着文献计量学、计算机与期刊数据库的深入发展,影响因子越来越暴露出其不合理的一面,如引用质量、自引、跨学科比较、统计源期刊等问题[2, 3]

近几年,围绕期刊影响因子,文献[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14]的作者提出了相关讨论。但是,"鉴于IF与H指数不能反映引用质量以及SJR指数与Eigenfactor计算复杂"[5]这一事实,很多建立在经典影响因子基础上的研究结果也显的不完善。如:刘雪立[6]、韩维栋[7]、戴丽琼[8]指出"期刊的影响因子主要由少数高被引论文贡献的";张垒[9]认为"高被引论文倾向于引用影响力较高的期刊而且高被引论文对影响因子的贡献度较大"。如果这些低被引文章大部份都是被Science或者Nature一类顶级刊物所引用,那么其对影响因子的贡献度也不会小。为了克服经典影响因子计算公式无法反应引用质量所带来的缺陷,张新玲[1]指出 "鉴于引用期刊影响因子不同,建议在计算影响因子时,细化期刊中文章被引用次数,深入运用引用期刊影响因子,采用加权求和算法(m1i1+ m2i2+,…,+ mmim),并提出深度影响因子Is"。郑美莺[4]则提出"基于引用期刊学术质量的影响因子修正法,即追踪引用者产出论文所在刊物的学术质量(影响因子),设计以权重修正的影响因子计算方法"。然而,文献[1]IS公式中的影响因子仍然为经典影响因子,这就导致其结果并不完善,并且有可能产生错误。而文献[4]引入的质量权重计算方式相对简单,得出的结果也较为粗糙。评价指标的选取及权重的确定在期刊评价过程中起着非常重要的作用[10]。本研究结合文献[1]的"加权求和算法"以及文献[4]的"考虑引文质量权重作为评价指标",将IS算法中的引文影响因子替换成重新定义的引文质量权重,并考虑两年的情况IS*。该方法能较好的克服IS公式中采用经典影响因子所带来的精确度差的问题。同时,也是对文献[4]计算方法的一种的修正和补充。以期达到能够更加准确和客观的表达期刊影响因子的目的,亦是对两年期影响因子计算公式的修正。

1 对经典两年期算法的修正

对于经典两年期影响的计算公式,在文献[4]中用以下计算式来表达

其中:IFk,t表示第t年某刊Xk的影响因子;aj,k,t-1、aj,k,t-2分别表示每种期刊Xj在第t年引用第t-1、t-2年的期刊Xk的文章数;Nk,t-1Nk,t-2分别表示Xk在第t-1、t-2年的文章总数。

很显然,式(1)并未考虑到引用期刊的影响因子,只考虑到文章的引用数。"期刊载文的被引量可以评价期刊的学术水平。一般来说,期刊论文的被引量越大,则期刊的影响力越大。也就是说,不论被何种层次期刊引用,只要引用1次。被引频次就是1。该算法从引用次数上来计算期刊的影响因子,完全忽略引用期刊的影响因子"[1]。针对这一情况,文献[1]中给出了深度影响因子Is算法,但是该算法仅考虑了当年的情况,为了达到细化影响因子算法的目的,本文考虑t-1、t-2最近两年的情况,给出了下面算法。

其中:Is表示Xkt年的深度影响因子;aj,k,t-1、aj,k,t-2分别表示每种期刊Xj在第t年引用第t-1、t-2年的期刊Xk的文章数;Nk,t-1Nk,t-2分别表示Xk在第t-1、t-2年的文章总数;Ij,t-1Ij,t-2分别表示Xj在第t-1、t-2年的影响因子。

以下我们不妨就文献[4]给出的t-1、t-2年的数据,利用文献[1]的深度影响因子算法进行数值计算。

表2表3可以很清晰的知道,期刊X5t-1年和t-2年的被引用总数都略低于X6t-1和t-2年的被引用总数。但是,结合表1可知X5t-1和t-2年被较高影响因子期刊引用的次数居多。而X6t-1和t-2年被较低影响因子期刊引用的次数居多。并且X5X6在这两年文章总数也相差不多,因此,显而易见X5的期刊质量应该高于X6的期刊质量。

表4所示,按照经典两年期影响因子算法得到X6的影响因子为2.12,这大于X5的影响因子2.07,这个结果和上面的分析显然是相反的。而按照公式(2)计算出来的结果是:X5的影响因子为4.77,这明显大于X6的影响因子3.62,所以,相对经典两年期影响因子而言,影响因子IS更能准确、客观的反应刊物的学术质量。但是,IS计算公式中的影响因子Ij,t-1Ij,t-2的计算方式依旧是采用经典两年期的算法,所以IS计算方式也存在计算结果不够精确的缺陷。为了能够得到更加合理的结果,笔者认为在IS计算公式中考虑期刊的质量权重是一个不错的选择,即将Ij,t-1Ij,t-2这两年的的影响因子替换成引文的质量权重。但是,质量权重该怎么定义才较为合理?下面一节我们将结合文献[4]中对质量权重的定义来解决这一问题。

表1 10种期刊在某2年的影响因子及文章总数[2]

表2 10种期刊在t-1年的相互引用(aj,k,t-1)情况[2]

表3 10种期刊在t-2年的相互引用(aj,k,t-2)情况[2]

表4 两种算法计算后的10种期刊影响因子对比
2 对以期刊质量为权重的影响因子算法的修正 2.1 基于当年质量权重的影响因子计算方法

对于考虑期刊质量的影响因子算法,文献[4]提出了考虑以期刊质量为权重的影响因子算法。该计算公式"直接利用期刊影响因子占所有期刊影响因子的比重,作为该刊质量的权重"[4]。虽然,通过此法给出了相对于经典两年期影响因子计算公式更为准确的结果。但是,该公式中期刊质量权重,只是简单的近两年的影响因子之和占所有期刊的影响因子的比重。文献[4]的影响因子表达式如下:

其中是权重。IFj,t-1和IFj,t-2(j=1,2,…,n)分别是t-1年和t-2年的期刊影响因子。虽然wj这种加权平均算法在影响因子相差不大或者很接近的情况下是相对合理的(即可用wj来表示t-1和t-2这两年的质量权重)。但是,实际情况是即使同一个期刊在t-1年和t-2年的影响因子较接近,但也存在差别。那么期刊的质量在t-1和t-2这两年是有所不同的。这说明在t-1和t-2年分别考虑不同的质量权重wj,t-1和wj,t-2是非常有必要的,同时也更为合理。有鉴于此,本文充分考虑期刊t-1和 t-2年影响因子分别占t-1和t-2年所有期刊影响因子之和的比重作为期刊在t-1和t-2年的质量权重wj,t-1和wj,t-2,结合(2)给出了以下影响因子计算式:

其中w,aj,k,t-1、aj,k,t-2分别表示每种期刊Xj在第t年引用第t-1、t-2年的期刊Xk的文章数;Nk,t-1Nk,t-2分别表示Xk在第t-1、t-2年的文章总数;IFj,t-1IFj,t-2分别表示Xj在第t-1、t-2年的影响因子。 下面我们不妨利用文献[4] 表1中的数据,来验证公式(4)的有效性和可行性。

表5可知:文献[4]的质量加权wj的数值几乎全部介于本文wj,t-1wj,t-2的数值之间,这也从数据方面说明了文献[4]质量加权wj反应的是期刊在t-1和t-2这两年质量的"平均值",而本文(4)的质量加权算法wj,t-1wj,t-2则反应的是刊物近两年具体的质量情况。所以,本文算法(4)相对于文献[4]算法而言更为合理

表5 10种期刊在t-1和t-2两年的影响因子和比重
2.2 影响因子计算公式的精确度分析

以下表6为本文影响因子算法(2)、(4)和经典两年期算法以及文献[4]算法的计算结果对比。

表6 四种算法计算后的10种期刊影响因子对比

表6可以看出除了经典两年期算法计算出来的结果和实际情况相反(X5被较高影响因子期刊引用的次数比X6多,但是影响因子却比X6低),其他三组的数据均能如实反映实际情况。很自然的这就会涉及到余下三组数据的计算式(2)和(4)的精确度问题。从表5分析可知,本文(4)算法IS*考虑到了期刊在t-1、t-2两年期刊的质量会有所不同,并在(4)中加入了t-1和t-2年不同的质量权重。所以,这种计算方式更为科学合理,所得结果应更为精准。但这仅是从评价指标定义方式所得结论,而影响因子最终计算结果是否支持这一推论才是关键所在。那么表6数据是否会支持这一观点?

我们从表6中可以看到10种期刊的影响因子 按照本文(4)计算方法计算出的结果,在不同程度上均低于文献[4]计算方法所给出的结果,且并未出现过高于文献[4]计算方法所给出结果的现象。同样的,10种期刊经文献[4]计算出的影响因子明显低于经本文(2)计算方法Is计算出来的结果。即这三种算法所求的数值纵向对比是呈递减趋势的,这种趋势说明这三种计算方法的精确度是朝一个方向发展的(递增或者递减)。那么区分这三种算法(IS、IFk,t*、IS*)精确度大小问题就可以归结为分析精确度的变化问题(确定IFk,t*、IS*的精确度较IS变大或者变小)。

下面我们结合表7中数据从相邻两个期刊影响因子的差值角度来讨论计算结果精确度问题。

表7 (2)、(4)以及[4]的三种算法的9组期刊相邻影响因子差对比

表7不难发现,考虑两年情况的Is的9组相邻影响因子差,均比考虑质量权重计算式所算出来的结果高,虽然,这个差值从直观上不能直接作为衡量这两个计算方法精准度的手段。但是,经典两年期影响因子计算式是在各个期刊间影响因子相差不大的情况下能较好区分期刊质量,而本文所基于的数值模拟也是在各期刊影响因子相差不大的情况下完成的。所以,经过某个算法计算后,期刊间影响因子差值变化越明显(差值变化大),则说明该算法越不精确。综合以上分析,考虑两年情况的Is的数值从横向(相邻影响因子差)明显要高于文献[4]算法IFk,t*IS*。所以,横向数值对比支持IFk,t*IS*的精确度较IS有所提高这一事实。结合表6的分析结果可知:这三种计算方法的精确度是递增的,IS*最高,IFk,t*次之,IS最差,这也充分说明在细化期刊影响因子的时候,考虑期刊的质量权重应以(当年)期刊影响因子占所有期刊影响因子的比重的可行性和必要性。

3 小结

在研究细化期刊影响因子计算式时,着重考虑引文质量权重的计算方式,这对精确影响因子计算结果起较好作用。虽然,利用该计算方式并通过数值模拟后能给出相对客观、合理的数据。但是,新的计算公式的提出只是对前人工作的一种补充和改进,它仅是从技术层面上来完善影响因子计算结果。然而,现实当中的影响因子不仅只受到计算方式的影响,目前不单是国内在盲目崇拜影响因子,刘雪立在文献[16]也指出西方国家也存在"影响因子越高,期刊水平就越高"这一说法,所以,人为地制造文章高被引频次以期达到提高影响因子的现象随处可见。这样造成的结果是这类抱团互引的期刊的影响因子是不可信的。尽管,单纯的从技术层面对期刊影响因子的计算公式进行改进,并不能完全克服影响因子存在的实际问题,这类问题还需要国家制定完善相关的政策来加以解决。但是,希望此类期刊影响因子的修正法的提出,可以起到抛砖引玉的效果,能为期刊评价体系研究提供一定的理论依据。

参考文献
[1] 张新玲,郑宗荣,曾敏莉.期刊评价指标——深度影响因子(IS)[J].农业图书情报学刊, 2014, 26(6):137-140.(6)
[2] Lange L.The impact factor as a phantom:Is there a self-ful filling prophecy effect of impact[J].Journal of Documentation, 2002, 58(2):175-184.(7)
[3] Butler L,VIsser S.Extending citation analysis to non-source items[J].Scientometries,2006,66(2):327-343.(1)
[4] 郑美莺,梁飞豹.基于引用期刊质量的影响因子修正法[J].编辑学报, 2015, 27(1):19-21.(19)
[5] 李超.引用质量加权影响因子评价学术期刊研究——以CSSCI图书情报学期刊评价为例[J].大学图书馆学报,2012(1):29-34.(2)
[6] 刘雪立,徐刚珍,方红玲.如何提高医学期刊的影响因子——从《眼科新进展》论文分类被引情况谈起[J].中国科技期刊研究, 2008,19(4):659-661.(2)
[7] 韩维栋,薛秦芬,王丽珍.挖掘高被引论文有利于提高科技期刊的学术影响力[J].中国科技期刊研究,2010,21(4):514-518.(2)
[8] 戴丽琼. 2006-2010年《中国肿瘤》高被引论文分析[J].预防医学情报杂志,2012,8(5):392-396.(2)
[9] 张垒.高被引论文的特征因素及其对影响因子贡献研究[J].中国科技期刊研究, 2015, 26(8):880-885.(2)
[10] 王磊,赵文义,孙守增,等.基于我国学术期刊属性的学术期刊质量评价体系研究[J].科技与出版, 2012(3):78-81.(1)
[11] 谢文亮.影响因子的设计缺陷及修正[J].中国科技期刊研究,2013,24(5):921-924.(1)
[12] 林国栋,华启清.影响因子对学术期刊及论文质量评价的适用性分析[J].福建农林大学学报:哲学社会科学版, 2013, 16(5):109-112.(1)
[13] 李建伟,杨阳.我国核心期刊评价体系现状及问题研究[J].评价与管理,2014,12(4):33-37.(1)
[14] 张亘稼.对期刊评价指标影响因子的修正[J].商洛学院学报, 2011, 25(3):86-88.(1)
[15] 陈锐锋,何以平,陈秋玲.影响因子作为科技期刊评价指标的负面影响分析[J].编辑学报,2009, 21(5):463-465.(0)
[16] 刘雪立.全球性的SCI现象和影响因子崇拜[J].中国科技期刊研究,2012,23(2):185-190.(1)