中国科技期刊研究  2015, Vol. 26 Issue (11): 1194-1199   PDF    
f(x)指数:期刊学术影响力评价新指标
邵作运1, 李秀霞2     
1. 曲阜师范大学日照校区图书馆, 山东省日照市烟台路80号 276826;
2. 曲阜师范大学传媒学院, 山东省日照市烟台路80号 276826
摘要[目的]为丰富期刊学术影响力评价指标体系,提出了一种新的期刊学术影响力评价指标-f(x)指数。[方法]以《中国科技期刊引证报告》2012年期刊目录中的34种图书情报学期刊为例,通过CNKI获取各期刊2012年的载文量、篇被引频次,利用excel、c++计算相应评价指标的得分,并根据f(x)指数的得分对期刊进行排名。[结果]与当年遴选出的CSSCI核心期刊相比,评价结果准确率达94.12%;对各指标进行相关分析,发现f(x)指数与包括影响因子在内的多种期刊评价指标存在较强的正相关。[结论]f(x)指数利用对数函数的性质,考虑了期刊的载文量、总被引、篇均被引等因素,考虑了低被引和高被引论文的差异性,可作为期刊学术影响力评价的指标。
关键词学术期刊    学术影响力    评价指标    f(x)指数    
The f(x)-index: a new index to evaluate the academic influence of journals
SHAO Zuoyun1, LI Xiuxia2     
1. Library of Rizhao Campus, Qufu Normal University, 80 Yantai Road, Qufu 276826, China;
2. School of Communication, Qufu Normal University, 80 Yantai Road, Qufu 276826, China
Abstract: [Purposes] In order to enrich the evaluation index system about the academic influence of journals, we propose a novel method which named f(x)-index.[Methods] Taking the 34 LIS journals of the china S&T journal citation reports of 2012 as examples, we acquired the published article volume and cited frequency of each journals through CNKI and calculated the corresponding parameter values by excel and C++ tools, in the end, ranking those journals according to the f(x)-index.[Findings] Compared with the CSSCI core periodical, the accuracy of evaluation results is about 94.12%. With analysis of correlation of each index, we find that the f(x)-index has a strong positive correlation with a variety of journals evaluation index which includes impact factor.[Conclusions] The f(x)-index not only considers the numbers of publications, citation count and average of citation count, but also the differences between low cited and high cited papers by using the properties of logarithmic function, which can be used as the evaluation of academic influence about journals.
Key words: Academic journals    Academic influence    Evaluation index    f(x)-index    
1 引言

学术期刊是知识传播和交流的媒介,在当今知识爆炸的时代,衡量期刊的学术影响力显得尤为重要。学术界和期刊界对期刊学术影响力评价方法的探寻一直没有停息,如2005年hirsch提出基于被引频次的h指数[1],次年,Braun便将h指数应用于期刊的学术影响力评价[2]。随之,又出现了基于h指数的g指数、hg指数、A指数、AR指数、e指数、j指数等[3],以上指标在学术影响力评价中各有优势和不足。其中,h指数[4]具有数量与质量相结合、计算简单、动态增长、适用性强、可测得期刊的持久绩效等特征,但h指数对低被引论文不敏感,对一个或几个显著的高被引论文不敏感等;g指数[5]注重知识的积累性和继承性,对被引频次非常敏感,但g指数对g篇以外论文的被引频次不敏感,同时还会受到少数几篇被引频次极高的论文的影响;hg指数[6]是h指数与g指数的几何平均值,其优点是:低水平的h指数下,hg指数的值随着g指数的增加呈现出柔和的增长,hg指数能够更细粒度地区分期刊的产出成果,但hg指数在综合体现期刊影响力方面仍有欠缺,即对没有贡献指数的论文不敏感、对总被引频次不敏感、对发文量不敏感等。

相比h指数、g指数和hg指数,影响因子不仅考虑了期刊的总被引频次,也考虑了期刊的载文量(影响因子是某期刊前两年发表论文在统计当年被引用的总次数除以该刊前两年发表论文的总数),因此,在期刊评价中更有优势。目前,在国内外期刊评价中,影响因子占据着重要地位。影响因子存在的局限性是对于极端数值的变化敏感。

本文尝试提出一种新的期刊学术影响力评价指标——f(x)指数,以改善上述期刊学术影响力评价指标的不足,丰富期刊评价指标体系,为同行专家对学术期刊的定性评价提供借鉴和参考。

2 期刊学术影响力评价指标f(x)指数 2.1 f(x)指数的提出

期刊学术影响力指标应该从期刊载文量、期刊总被引频次等整体视角来设计,适度考虑期刊低被引论文和高被引论文的在期刊学术影响力评价中的作用,既不能忽视低被引论文也不能强化高被引论文。

肖学斌[7]根据自然对数的性质,曾提出了衡量科研人员论文水平的论文计量指数——x指数。其表达式为:

${\rm{x = }}\sum\limits_{i = 1}^N {\ln (T} {c_i} + c)$ (1)

式中,Tci是某科研人员第i篇论文的被引频次,c为常数,取值范围为1≤c≤2;x指数充分利用对数函数的特征,提高了对研究人员科研水平的评估效能[7]。 受其启发,笔者尝试把对数函数引入期刊学术影响力评价中。但分析发现,x指数并不适用于期刊学术影响力的评价。x指数是基于被引频次来衡量科研人员的产出能力,没有考虑其总发文量,评价是衡量“产出/投入”比的一种重要手段,单看产出,不考虑投入的指数难免有失偏颇。如两个期刊的载文量相等,x指数越高,则影响力越大;但如果两个期刊的载文量不等,单纯由x指数的高低决定期刊水平就不公平了。同时,x指数过度弱化了高被引论文的贡献,相对放大了低被引论文的作用。如A期刊发文70篇,其中有60篇被引次数为1,B期刊发文也是70篇,其中有6篇被引次数为1次,34篇被引次数为2次,按照公式1计算(取c=1),xA=60×ln(1+1)=41.586,xB=6×ln(1+1)+34×ln(2+1)=41.511。即A期刊的影响力大于B期刊的影响力,但我们更倾向认可B期刊的影响力。并且有些刊期为旬刊的期刊,在年被引论文中被引频次为1的论文高达300多篇,而高被引论文极少,用x指数来评价这样的期刊,得出的结论是学术影响力很高,显然不合理。

基于上述,本文对x指数进行修正,提出用于期刊学术影响力评价的新指标,并以函数的统一标识符号“f(x)”来命名,称为f(x)指数。

根据对数函数的性质,对数函数$f(x) = log_a^x$(a>1),底数a越大,对数值y随自变量x的增大而增大的速度越慢,反之,底数a越小,对数值y随自变量x的增大而增大的速度越快,见图1所示。

图 1 底数大于1且底数不同的对数函数图像

由此,我们将期刊的被引频次分为两个区间,在两区间分别取不同的底数。对低被引频次的论文,令a=10(即取常用对数f(x)=lgx),这样可以弱化低被引论文对期刊的作用;对高被引频次的论文,令a=e(即取自然对数f(x)=lnx),这样在抑制个别高被引论文的同时,又通过取自然对数来整体提升高被引论文的作用,当然,为继承x指数的优势,这种提升作用要小于抑制作用。由于不同学科期刊的高、低被引情况有较大的差异,分区边界应视期刊的学科性质做适当的调整。

改进后的f(x)指数表达式如下:

$f(x){\rm{指数}} = \\ \left[{\frac{{\sum\limits_{i = 1}^{{N_1}} {\lg (T{c_i} + c)\left| {T{c_i} = 1、{\rm{2}}、{\rm{3 + }}\sum\limits_{i = 1}^{{N_2}} {ln(T{c_i})\left| {T{c_i} \ge 4} \right.} } \right.} }}{{D(Y)}}} \right] \times {10^{\rm{n}}}$ (2)

式中,Tci是第i篇论文的被引次数;c为正整数常数,加c是为了避免当Tci=1时lg1=0的情况出现,如果取>1,则会计入0被引频次论文的影响,综合考虑,c取1;N1N2为被引频次在一定范围内的论文数,其取值由被研究期刊集的学科性质和数据集特点来决定。本文根据图书情报学期刊的载文量和被引频次的分布特点,N1为被引频次在1—3的论文数,N2为被引频次大于等于4的论文数;n为常数,10n的作用是为了平衡高载文量导致指数值过低的数值,n=1,2,…,根据研究期刊载文量的规模来取值,本文n取1;D(Y)表示第Y年某期刊的载文量,目的是为了从期刊论文的篇均被引情况来评估期刊的影响力,体现了公平公正的评价原则。

2.2 f(x)指数的优势

f(x)指数是基于底数大于1的对数函数的性质提出的,具有以下优势:

(1)以a(a>1)为底的对数函数是单调上升的函数,能够体现期刊评价的一种共识,即论文被引数越多,期刊影响力越高。

(2)以a(a>1)为底的多个数的对数值之和大于这些数的和的对数值,如ln20+ln30=6.397,ln50=3.912。该性质可以有效抑制个别高被引论文对期刊评价效果的影响。

(3)以a(a>1)为底数的对数函数,当和相等时,加数之间的差距越小,各加数的对数值之和越大。如ln20+ln20=5.992,ln5+ln35=5.249。这一性质体现了对数函数的稳定性,可以有效抑制被引频次极端化的论文对期刊评价效果的影响。

(4)将期刊按被引频次进行分区,根据区间不同选取不同底数的对数可以弱化低被引论文对期刊的作用,并能在整体上提升高被引论文对期刊的作用。

(5)f(x)指数不是单纯基于被引频次来衡量期刊的影响力,而是在载文量的基础上来观察被引频次,既重视期刊的被引频次,又考虑了没有被引论文的影响,使期刊评价效果更加公平、合理。

2.3 f(x)指数计算示例

算例:假设两期刊A、B载文量相同,均为20篇,期刊A有8篇论文被引,被引频次分别为18、15、9、7、6、6、2、1;期刊B也有8篇论文被引,被引频次分别为12、10、9、8、7、6、6、6。利用总被引频次、h指数、g指数、hg指数、f(x)指数的计算公式分别计算A、B两期刊的影响力得分(这里取n=1)。见表1

表 1 A、B两期刊不同评价指标下的学术影响力对比

表1可见,两期刊的载文量、总被引频次、h指数、g指数、hg指数均相同,似乎两期刊具有相同的影响力;但根据f(x)指数对比,有f(x)Af(x)B。期刊A虽然有两篇论文被引频次较高,但也有被引频次比较低的论文,而B期刊论文的被引频次相对比较集中,评价结果为B期刊的学术影响力高于A期刊的学术影响力,也符合大众接受的心理。所以说,f(x)指数更加稳定,不受个别高被引论文的影响,能够更加精细地评价期刊的学术影响力。

3 f(x)指数效果验证及分析 3.1 数据来源和处理

《中国科技期刊引证报告》按期刊学科分类,公布了40种图书情报类期刊,我们选取其中34种期刊作为研究对象(其余6种期刊或者无法获取单篇论文的被引频次,或者属于文献学期刊,故而没有选作研究对象)。考虑到期刊论文尤其是核心期刊论文发表后2—3年是其引用高峰期[8, 9],所以通过中国知网(CNKI)和《中国科技期刊引证报告》获取34种期刊2012年的相关数据为研究基础。具体操作步骤为:通过《中国科技期刊引证报告》得到2012年34种期刊的影响因子;登陆CNKI,选择高级检索,发表时间选择2012年1月1日—2012年12月31日,在论文来源中分次输入期刊名称,按被引次数对期刊论文排序,检索并记录34种期刊的载文量、每篇论文的被引次数等数据。然后根据总被引频次、h指数、g指数、hg指数、x指数、f(x)指数的定义,在excel环境和c++环境下计算各期刊2012年度的各指标数值,与相应期刊该年度的影响因子一起,按f(x)指数的数值大小排序列于表2中,以备后文对比分析。

表 2 2012年34种图书情报期刊评价指标结果(按照f(x)指数由大到小排序)
3.2 评价结果分析 3.2.1 与同年遴选的CSSCI期刊对比分析

表2 中的数据可以看出,2012年图书情报类34种期刊中f(x)指数大于等于7.1825的期刊有 17 种,其中《中国图书馆学报》、《大学图书馆学报》、《图书情报工作》的f(x)指数分别高达 21.614、12.4925、12.477,位居榜首,这与近年来《中国图书馆学报》、《大学图书馆学报》这两种期刊在图书情报类期刊中一直处于权威地位、近年《图书情报工作》在图书情报学期刊CSSCI中的排序由第四位跃居第三位的现状是一致的。对比2012年南京大学核心期刊CSSCI来源期刊目录,发现:除去CNKI中没有公布的期刊《情报学报》和档案学期刊《档案学研究》、《档案学通讯》3种期刊外,其余的核心期刊只有一种《图书馆理论与实践》没有在前17种期刊之列,但非核心期刊《图书馆学研究》却进入了前17名。

由于每年核心期刊的遴选依据的是期刊前一年、前两年的一些评估指标值(如总被引频次、影响因子),所以,客观考察2012年期刊的学术影响力,应该与2014年的核心期刊遴选结果进行比对。2014年南京大学核心期刊CSSCI来源期刊目录中图书情报学期刊与前几年的一个明显不同就是《图书馆学研究》进入了核心期刊的行列,而《图书馆理论与实践》被移出了CSSCI核心期刊。由上面的分析可见,f(x)指数对期刊的评价结果准确率还是很高的,仅以期刊是否在CSSCI之列来估算,准确率达94.12%,这说明f(x)指数可以用于期刊学术影响力的评价。

3.2.2 期刊评价效果对比分析

为进一步证明f(x)指数在期刊学术影响力评价中的有效性,将34种期刊的2个常用指标(影响因子、h指数)、评价科研人员学术水平的指标x指数和本文提出的f(x)指数分别作归一化处理,并绘制34种期刊对应的上述4个指标的指标值图。如图2所示。

图 2 2012年34种图书情报期刊不同指标归一化后的得分比较

图2不难发现:各期刊的f(x)指数曲线与影响因子曲线走势总体一致,f(x)指数与h指数在非核心期刊(图2虚线右侧)区域曲线走势基本一致,但在核心期刊(图2虚线左侧)区域曲线走势有较大的不同,说明f(x)指数在期刊评价中比h指数具有更高的稳定性。h指数与x指数都没有考虑期刊的总载文量,图书情报类期刊载文量差别很大,有旬刊、半月刊、月刊、双月刊,不考虑载文量,只观察被引频次是不合理的。同时,x指数没有综合考虑高被引期刊和低被引期刊对期刊影响力的差异性,所以图2x指数曲线波动幅度最大,而且评价结果与期刊的真实学术水平存在较大的差异,如利用x指数对《中国图书馆学报》、《大学图书馆学报》的评价得分就相对靠后。通过上面的对比分析,可见f(x)指数是一个较好的期刊学术影响力评价指标。

3.2.3 f(x)指数与其他期刊评价指标间的相关性分析

为了更精细地呈现f(x)指数与其他指标之间的关联性,我们在SPSS环境下,利用表1的数据计算各个指标之间的 Spearman相关系数,见表3

表 3 f(x)指数与其他几种典型期刊学术影响力评价指标之间的相关性

表3发现,f(x)指数与除载文量外的其他所有指标均呈正相关,其中与影响因子和h指数呈强相关,相关系数分别为0.906 (P<0. 01)和0.911(P<0. 01)。影响因子是国际国内衡量期刊学术影响力的最有价值的指标,h指数在期刊学术影响力评价中虽然有不足之处,但已是被大众接受的指标之一,说明f(x)指数可以作为期刊学术影响力评价的指标。

载文量是不能作为衡量期刊学术影响力指标的[10],由表3还发现,载文量与影响因子、g指数、f(x)指数均呈负相关,与f(x)指数的相关系数为-0.256。除载文量与外,其他指标间均存在显著的相关性。而h 指数、g指数、hg 指数之间均呈强相关,这与g指数、hg 指数与h指数同根同源相吻合,正因如此,f(x)指数与g指数、hg 指数也具有较高的相关性,相关系数分别为0. 907和0.910。但f(x)指数与x指数的相关性较低,仅有0.309,虽然f(x)指数是在x指数的基础上改进的,但二者在期刊学术影响力评价方面却有很大的差异,鉴于x指数与影响因子、h指数的相关性不高,分别是0.23和0.565,可以说,对x指数进行改进后的f(x)指数能够用于期刊学术影响力的评价。

4 结论

x指数是肖学斌提出的评价科研人员论文水平的计量指标,本文在分析x指数的基础上,提出了评价期刊学术影响力的新指标f(x)指数。f(x)指数综合反映了学术期刊的载文量、总被引频次、篇均被引频次等因素;同时,f(x)指数利用对数函数的性质,通过对低被引论文和高被引论文的被引频次进行分区,按区间选取不同底数的对数分别计算被引论文对期刊学术影响力的贡献,既有效抑制了低被引论文的作用,同时又适度考量了高被引论文的作用,从而更加客观真实地反映了期刊的学术影响力,使期刊评价效果更加科学合理。

f(x)指数与影响因子、h指数的高度相关性表明f(x)指数可以作为期刊学术影响力评价的指标;对图书情报类34种期刊的评价结果表明f(x)指数在期刊学术影响力评价中是有效的。

当然,f(x)指数仍存在已有指标的一些不足之处:f(x)指数不能反映期刊论文的最高被引情况,而且仍默认所有引文具有同样的权重,也没有排除自引现象对评价结果的干扰。

参考文献
[1] Hirsch JE. An index to quantify an individual's scientific output[J].Proceedings of the National Academy of Sciences of the United States of America,2005,102:16569-16572.(1)
[2] Braun T,Glanzel W, Schubert A. Hirsch-type index for journals[J]. Scientometrics,2006,69 (1):169-173.(1)
[3] 王梅英,刘雪立,王璞.h-指数及其扩展指标在期刊评价中的应用[J].情报杂志,2012, 31(3):60-64.(1)
[4] 杨槐.基于论文计量的国际h指数研究综述[J].情报科学, 2011, 29(9):1430-1434.(1)
[5] Egghe L.An improvement of the h-index:The g-index[J].ISSI Newsletter,2006,2(1):8-9.(1)
[6] Alonso S,Cabrerizo F J, Herrera-Viedma E, et al. hg-index:A new index to characterize the scientific output of researchers based on the h-and g-indices[J]. Scientometrics,2010,82:391-400.(1)
[7] 肖学斌.x指数:描述研究人员论文水平的论文计量新指数[J].图书情报知识,2015(2):93-99.(2)
[8] 张洋,张淑玲.中美医学院网络信息计量指标的比较分析[J].图书情报工作,2011,55(4):24-27,66.(1)
[9] 金晶,何苗,王孝宁等.不同学科领域自然科学论文学术影响力评价与比较的可行性研究[J]. 科技管理研究,2010,(14):279-284.(1)
[10] 黄贺方,孙建军,李江.期刊影响力评价指标之间的相关性研究[J].情报科学, 2011,29(9):1322-1326.(1)