西南石油大学学报(社会科学版)  2017, Vol. 19 Issue (2): 112-120
浅析当前世界语言学研究的特点和趋势——基于2006-2015年Web of Science的文献    [PDF全文]
周宙1, 邱树华1, 文彦元2, 刘建军2    
1. 西南石油大学外国语学院, 四川 成都 610500;
2. 西南石油大学学报中心, 四川 成都 610500
摘要: 近年来,语言学研究日益受到学术界的广泛关注,采用文献计量学方法,对Web of Science(WOS)收录的2006-2015年以语言学(linguistics)为主题的相关文献进行了分析。分别从文献的发表时间、学科分布情况、发表的国家/地区、出版物分布的情况、作者的分布情况及文献的被引频次分布等9个方面入手,利用统计工具对采集的数据进行定量与定性分析,在此基础上得出美国和中国大陆地区的相关数据,并特别探析了中国大陆地区语言学界的研究方向及他引情况。研究结果表明:语言学研究在近年来发展较平稳,在保持传统学科持续发展的同时,出现了新的研究领域,学科交叉融合趋势明显,而从在语言学研究方面占据优势地位的国家和地区上看,语言材料和交叉学科的支撑有较为明显的作用。在总体把握近10年来世界各国于该领域研究进展和研究现状的基础上,就我国相应学科的发展提出一定的参考性思路。
关键词: 语言学     web of science     文献计量分析     数据库     洛特卡定律     普赖斯定律    
A Bibliometric Analysis of Linguistics Literatures from Web of Science
Zhou Zhou1, Qiu Shuhua1, Wen Yanyuan2, Liu Jianjun2    
1. Southwest Petroleum University School of Foreign Languages, Chengdu Sichuan, 610500, China;
2. Southwest Petroleum University Journal Publishing Center, Chengdu Sichuan, 610500, China
Abstract: Based on the theory of bibliometrics, this paper conducts quantitative and qualitative analyses of the linguisticsrelated theses published from 2006 to 2015 in Web of Science, looking into publishing years of articles, research subject distribution, the countries and districts of articles, journal publication and authors, and the citation frequency of articles for the general assessment of the status quo of linguistic researches across the world. We also discuss the research directions and the citations of the papers in China, in comparison with those in America. The research results show that in recent years linguistics has seen a stable development, and is becoming increasingly interdisciplinary with an extension into new research fields. And language materials and other related disciplines play an important role in the development of the linguistics in countries and regions that occupy the dominant position in linguistics research. Based on the analyses, the present paper tries to provide references for the development of linguistics in China.
Key words: linguistics     web of science     bibliometrics     data base     Lotka Law     Price Law    
引言

语言学研究的历史由来已久,特别是于19世纪进入语言学阶段后,它成为人们研究的对象[1]。随着理论的不断深入和技术操作上的不断演进,语言学的理论更趋多源,如功能语法和语言类型学,同时也出现了部分新的研究领域,如计算机语言学等,交叉性特征尤为明显[2]。美国科技信息所(ISI)于1997年推出数据库产品Web of Science,提供了高水平的研究文献索引,主要包括SCI、SSCI、A&HCI等子数据库,其涵盖门类包括自然科学、社会科学、艺术及人文科学等诸多领域。在Web of Science上收录的文章,其所体现的研究成果代表着世界最高水平。因而,对于在总体上把握世界范围内语言学的研究动态而言,Web of Science所提供的SSCI数据库有相当的研究价值。对该数据库上语言学研究的总体状况进行分析,并从中发现研究主流方向和热点领域,能够较好地把握语言学学科的成长情况。而将我国大陆地区的语言学研究成果提取出来进行整理,并和世界范围内语言学研究现状对比,和世界先进国家比较,可以对我国语言学研究现状做出评估,找出我国研究与领先国家之间的差距,使我国语言学者能够较好把握该领域的前沿发展态势,推动我国语言学研究在结构上进一步合理化,在内容上进一步前沿化和热门化,最终在总体上提升我国语言学研究的水平。

1 语料数据的来源和研究的基本过程

本文收集2006—2015年期间SSCI数据库收录的语言学文章,借助数据分析工具,以文献计量学为理论支撑,以检索到的文章为切入点,总体把握世界范围内、美国和中国的语言学研究状况,并在此基础上进行评估,以期对我国语言学研究和学科发展提供相应的建议。下面介绍本文的数据来源、检索方法、分析方法和分析内容。

(1)数据来源。研究数据主要来自ISI Web of Knowledge所提供的Web of Science引文数据库,以其两个子库Social Sciences Citation Index(SSCI)和Art & Humanities Citation Index(A & HCI)为对象,将时间限定在2006—2015年(检索时间为2016年4月8日)。

(2)检索方法。点击打开Web of Science,以general search为检索方式,将Web of Science的子数据库限定为SSCI和A & HCI,将搜索目标限定为“主题”搜索,同时将发表年限设置为2006—2015年,最后在字段中以“ linguistics”作为关键词进行搜索,查寻相关文献,同时将其类型限定为研究性论文(Article)。以此方法获得的命中文献共计3 867篇。

(3)分析方法。将检索获得的3 867篇论文以Web of Science所给定的格式,保存为txt格式的文档,并将所获得的多个文档进行合并,以便于之后寻找特定的关键字段。之后将所获得的数据导入Microsoft Office Excel 2007办公软件进行统计和分类处理,并以文献计量学三定律布拉德福定律、齐普夫定律、洛特卡定律及作为补充的普赖斯定律为分析模型,对采集到的数据进行处理,同时进行定量和定性分析。

(4)分析内容。以检索到的文章为切入点,从语言学研究的发展状况、各学科的研究情况、以国家和地区为单位的研究情况、文章的出版期刊、发文作者、他引情况、高引用文章、高频关键词等方面进行研究,力图把握世界范围内语言学研究的总体情况。在此基础上,就中美两国的语言学研究方向和他引情况进行统计和对比,尝试发现中国语言学学界研究的优势和不足,并给出相应建议。

2 全球语言学研究现状评估 2.1 文献发表时间分布情况

语言学文献发表的时间分布一定程度上可以反映出学科总体发展水平。2006—2015年被SSCI和A & HCI收录的论文共计3 867篇,各个时间段的发表情况详见表 1

表1 文献发表时间分布情况表

表 1可以看出,2006年至2015年间,语言学研究论文数量总体保持了一定的增长态势。2006年至2009年的4年间的增长速度较快,单年载文量由170篇增加至385篇,年均增长率达31.32%。其后至2012年发展总体平稳,年均增长率收窄至3.43%。而2012年至2013年的增长速度再次出现上扬态势,增长率达18.08%,之后增长趋缓,为2.16%。依据普赖斯给出的文献增长模型[3]299,文献增长分为诞生阶段、发展阶段、成熟阶段和饱和阶段,可推断出语言学的发展已进入成熟阶段。

2.2 文献涉及学科分布情况

文献涉及的学科分布反映出各学科的研究情况和关联态势。语言学学科关注度前10位的结果如表 2所示。

表2 论文研究方向分布情况表

排名前4位的分别是语言学、教育学、心理学和交际学。排名第1位的语言学研究中,纯理论研究和对语言材料的解析占有很大比重(这种独立性或源于研究对象的独特性)。引用频数最高的前20篇文章多集中在纯理论研究,如Against markedness(and what to replace it with)[4],对标记理论提出质疑;也有分析语料的文章,如Language re-use among Chinese apprentice scientists writing for publication[5],以应用语言学论文写作为对象进行分析;或者是对宏观层面的语言现象进行研究,如Ethnolinguistic repertoire: shifting the analytic focus in language and ethnicity[6],关注民族语言学层面的问题。排名第2的是教育学,其研究有涉及语言习得机制的,如A dynamic metacognitive systems account of Chinese university students’ knowledge about EFL reading[7],试图讨论元认知和阅读理解之间的关系;有涉及课堂教学方法的,如Researching and developing interdisciplinary teaching: towards a conceptual framework for classroom communication[8],探讨跨学科环境下课堂交流的概念化;也有讨论语言输出问题的,如More does not mean better: frequency and accuracy analysis of lexical bundles in Chinese EFL learners’ essay writing[9],认为中国学生英语学习在量上的进步明显高于精确性的进步。排名第3的心理学多关注认知语言学,主要探讨认知程序,如Left-right coding of past and future in language: the mental timeline during sentence processing[10],讲述时间概念的空间化编码,并多有涉及神经语言学,如Evidence of pragmatic impairments in speech and proverb interpretation in schizophrenia[11],研究语言能力受损的状况。而之后第4位的交际学多覆盖语用学的研究领域,如The dynamics of power and resistance in police interview discourse[12],探讨的是权力关系对交际地位的影响。

排名第8位的计算机科学和排名第11位的信息科学及图书馆科学也有相当的发文量。前者主要关注的是语言材料的数字化、语言活动的模拟,如Learning to laugh(automatically): computational models for humor recognition[13],讨论的是计算机对幽默文本的识别;后者主要倾向于从信息化的角度去处理问题,如Language use reflects scientific methodology: a corpus-based study of peer-reviewed journal articles[14],关注用机器分析去理解文章同行审议。

2.3 文献发表国家/地区分布情况

文献发表的国家/地区分布显示出该学科在国家/地区范围内的研究活跃程度和成熟度,相应统计结果见表 3

表3 文献发表国家/地区分布情况表

表 3可以看出,语言学研究的传统强国多在欧美。中国大陆也较为有影响力,将其169篇文献进行进一步梳理,可发现香港地区在亚洲的语言学研究上独树一帜,基于香港大学创刊的JOURNAL OF CHINESE LINGUISTICS(《中国语言学报》)涵盖了该领域的所有7篇高水平文献。

此外,巴西和南非等非欧美国家的语言学研究也较为活跃,初步推断这可能与当地较为独特的语料资源有关(在WOS收录巴西的96篇文稿中,摘要中直接提及当地语料的有32篇;在南非的84篇论文中,则有28篇)。亚洲地区的中国、日本和台湾地区的语言学研究也较为活跃。

2.4 文献刊登的出版物分布情况

研究文献刊登的出版物分布可以帮助人们确定相关研究的核心期刊,一来可为文献的采购和管理提供目标支持[15]143-149,二来可为投稿者和读者提供有价值的信息。经梳理和统计,刊登文献数量前10名的期刊见表 4

表4 刊登文献数量前10名的期刊情况表

从表中可看出,目前语言学研究的关注点主要为语用学、符号学、语料库语言学、话语分析和应用语言学等方面。这与表 2从文献研究方向上的情况稍有不同,尤其在教育学和心理学方面分布并不一致,由此可以推断出这两方面的文章在期刊的分布上较为分散。

检索涉及的期刊共1 054种,根据布拉德福定律[3]156,通过累计计算可得排名前49位(占总期刊数量的4.75%)的期刊为核心期刊,其平均载文量达26.31篇,为平均载文量(3.67篇)的7.17倍。

2.5 文献作者分布情况

研究文献作者的分布情况有助于确定核心作者,以便寻找该领域的合作者。本研究统计的作者共有5 590位(含第二作者等所有论文合著者)具体分布情况详见表 5。从表中可以发现,发表4篇以上论文的作者有76人,占全部作者的1.37%,所发表论文为401篇,占论文总量的10.37%。

表5 作者发文情况表

洛特卡定律基于“科学生产率”的统计研究基础出现,其作用是获取关于信息生产者的分布情况[15]173-180,可描述为写n篇论文的作者数量大约是写1篇论文的作者数量的1/n2。统计结果发现,发文1篇的作者共4 846位,照此估算,发2篇作者应约为1 211位,远高于统计结果中的545位,这说明语言学核心作者尚未形成。

普赖斯定律[15]188-190认为,发表m=0.749 $\sqrt {{n_{\max }}} $篇以上论文的学者可认定为杰出科学家,其所发表的论文数量等于全部论文的一半。n在本次统计结果中为13,所以m取整数得3。因而可知发文超过3篇以上(含3篇)的作者共199位(占总数的4.11%)。发文前10位作者的论文被引总数高达724,占所有文章总被引次数10 977的6.6%,详见表 6。其中,GRIES S T所发表的13篇文章中直接涉及语料库的文章达7篇,也体现其研究热度;而第二的MCNAMARA D S的13篇文章中,关注写作的有10篇,重点探讨的是语言输出行为。

表6 语言学研究核心作者情况表
2.6 论文被引频次分布

文章被引频次所体现的是学科研究热点。科学计量学表明,若一篇文献每年被引用4次或以上,可被视为经典文献[3]363表 7反映的是引用频数最高的11篇文章。

表7 语言学研究的经典文献(被引次数80次以上)情况表

上述经典文献分布的期刊较为分散,其中心理学(《心理学公报》和《发展心理学》)和认知科学(《认知科学论题》和《认知科学》)各2篇,而语言学(《语言学期刊》)、生物学(《皇家学会哲学学报杂志B卷:生物科学》)、自然科学(《自然》)、管理学(《战略管理期刊》)、经济学(《会计与经济学杂志》)和综合类期刊(《美国国家科学院院刊》)各1篇,表明语言学研究中心理活动和认知过程尤为受到关注。

2.7 高频关键词和研究热点分布情况

采用词频分析法对关键词进行分析,可发现相应研究前沿。表 8是对被引频次排名前200名文献的关键词进行分析的结果。

表8 高频关键词表

表 8可以看出,corpus linguistics(语料库语言学)是近10年来语言学研究的热点之一,这与表 6对高引作者的分析一致。其中一篇高引论文‘ Am I normal?’ Teenagers, sexual health and the internet[16]基于语料库语言学,对英国一家青少年健康网站的咨询信息进行数据采集,对有关健康的词汇进行标记,并确认其“类别”,这对医护语言体系的完善和相关人员培训有促进作用。对引用频率最高的5篇文章(共计188篇)进行引文分析,发现其影响辐射集中在语言学(103篇)、心理学(55篇)、交际学(19篇)、医疗保健(18篇)和神经学(16篇)。另外,还有行为学(5篇)和政府法规(2篇)。

表 8还可以看到,computational linguistics(计算语言学)也颇为语言学界关注。Chinese science and technology structure and infrastructure[17]一文通过学术成果探讨中国科技的核心能力和水准,并在与美国比较的基础上找寻中国研究的相对优势学科。对引用频率最高的5篇文章的引文(共计147篇)进行分析,发现其影响学科有计算机科学(26篇)、图书馆信息科学(26篇)、经济学(24篇)和教育学(21篇)。同时,公共管理(16篇)和工程学(8篇)也受到影响。

此外,metaphor(隐喻)和aphasia(失语症)等也是近10年来的研究热点。如Spatial and linguistic aspects of visual imagery in sentence comprehension[18]探讨的是在句子理解的过程中从空间和语言的角度去解释视觉意象的运作规律。又如Specific reading and phonological processing deficits are associated with damage to the left frontal operculum[19]一文采用损毁法研究左侧岛盖部的损伤和语音加工障碍之间的关系。另外,academic writing(论文写作)也颇受关注。如Seeking acceptance in an English-only research world[20]讨论在英语期刊主导世界范围内学术语言的大环境下如何获得期刊收稿许可的问题。

3 中国语言学研究与美国的语言学研究情况比较 3.1 美国在语言学领域的研究方向和他引情况

表 3表 4表 6表 7可以看出,美国在语言学的研究上占有领先地位,其语言学方面的研究情况如表 9所示。

表9 美国语言学研究方向

表 10可看出,美国语言学研究文献在其他国家和地区有较高的被引率,优势地位较为明显。亚洲的中国大陆(199篇施引文献,研究方向前三位的是语言学、计算机科学和经济学)、日本(104篇施引文献,排名前三的研究方向是语言学、教育学和心理学)和中国台湾地区(82篇,前三位的是教育学、语言学和计算机科学)对于美国语言学研究的跟进和关注情况较好。

表10 美国语言学文献他引情况表
3.2 中国大陆地区语言学研究方向分布和他引情况

表 11显示中国大陆语言学研究文献共169篇,总被引频数585次,篇均被引3.46次,高被引指数为13[21]。施引文献504篇,去除自引后为483篇,而其他引用分布情况见表 11

表11 中国大陆地区语言学研究方向

表 2作为研究总体背景,对表 9表 11进行比较,可以发现,中美两国的前四项研究领域与世界范围内语言学的传统研究方向一致。美国在计算机语言学、经济学和医学相关领域颇有建树,而中国大陆则在神经语言学上有相对优势。

表 12可以看出,中国大陆地区语言学文献见刊量相对较小,但有一定的影响力,国外尤其是美国也有相当数量的引用,但平均引文量和高被引指数较低。

表12 中国大陆语言学文献他引情况表
4 结语

综上所述,世界范围内语言学的研究在2006—2015年间发展较为平稳。从研究方向上看,在保持传统领域持续发展的同时,新科目的出现使学科交叉更复杂,影响面更广泛。中国大陆地区语言学研究状况和美国相比,表现出一种“总体合理,有待追赶”的态势。

(1)语言学研究方向前四位均为传统研究领域,说明其本身具有一定的独特性和封闭性质。从国别的研究情况来看,其研究的独特性或许与其研究材料有关。在学科交叉层面上,计算机科学、商学、经济学、医学及神经科学的引入使语言学的研究具有更为广阔的视野。语言学研究的作者群分布处于比较扁平的状态,核心作者群有待形成,而其分布也和语言学研究语料的分散性特点有关。

(2)从语言学研究的国别情况来看,欧美国家仍然处于较为领先的位置,而中国、巴西、南非等国借助于本国独特的本族语语言研究材料,也在语言学研究上提升了自身的影响力,有相应的研究成果出现。

(3)中国大陆地区在亚洲研究领域上(主要关注普通话的研究)处在相对优势的位置,但从整体的学科研究水平上看,和世界先进水平相比尚有一定差距。中国大陆地区自身在研究方向上有独特之处,和处于领先位置的美国相比,有一定的相对研究优势,但在技术操作要求较高的研究上相对落后。如在计算机科学的研究方向上,美国高水平文章数量高达45篇,而中国大陆在相应的研究方向上仅有5篇。这说明,中国大陆在计算机科学方面的研究从语言学的视角上还有一定的路要走。美国在商业经济学方向上的文章数量有27篇,同时在康复医学方向上的文章数量为22篇,而中国大陆在相应的研究方向上发文数量都还处于空白状态。可以说,美国在计算机科学、商业经济学、康复医学上和语言学的结合深度远远超过中国,而这三个领域,也恰恰是美国的优势方向。

(4)从研究方向的总体分布上来看,中国的研究方向分布和世界范围内研究方向的分布较为吻合,较为合理。但和美国的研究方向总体布局相比,中国的语言类学科和其他学科的交叉性比较滞后,除去在科学技术方面有所建树之外,其他方向都还处于语言学的传统研究领域,同时相应的应用性也有待加强。要解决这个问题,一方面是加强其他学科的建设,另一方面是依据中国的研究环境和研究需求,找到适合自身的学科交叉点。

(5)从高产作者、高引文章和高频关键词来看,语料库语言学和计算机语言学等学科属于研究热点,多关注语言交际和处理过程,同时对写作(特别是学术写作)也有相当数量的研究。而就施引文献的研究方向来看,其影响面涉及传统的语言学、心理学、交际学等,同时还辐射到经济学、工程学、公共管理以及政府法规等领域。总体上看,语言学研究向应用性上转变的趋势比较明显。而从中国大陆地区的研究主攻方向来看,对于语料库语言学和计算机语言学的研究目前尚处于成长阶段,这说明我国在计算机技术和数据库建库经验上尚有不足。

(6)从被引用频次最高的文章出版期刊来看,除传统意义上的语言学、心理学和认知科学外,影响力较大的还包括生物科学、经济学、人类学和管理学。而中国大陆的研究分布从总体上看还较偏向传统领域,单一性和封闭性较为明显,对于新兴学科的涉及和交叉不够深入。

(7)中国台湾地区在世界范围内的发文数量于国家地区中排名达第20名,显示其科研实力较为雄厚。同时,中国香港地区在亚洲研究方向上独占鳌头。中国大陆学者可以加强和港台地区的交流,分享研究经验,整合研究方法和操作技术,同时加强同其他国家学者的合作。从切入点看,加强学科交互性或许是当前我国语言学研究寻求突破点的关键,同时需要其他学科建设的支持和相互交流。例如在学术写作研究上,Web of Science收录了一部分高水平文献,就我国来看,在这一方面拥有大量独特的语料,而技术操作上也不存在太大困难,可以说是一个不错的研究切入点。

参考文献
[1] 张树铮. 语言学概论[M]. 武汉: 武汉大学出版社, 2012: 8.
[2] 顾曰国. 当代语言学的波形发展主题三:语言、媒介载体与技术[J]. 当代语言学, 2011, 13(1): 22–48.
[3] 庞景安. 科学计量研究方法论[M]. 北京: 科学技术文献出版社, 2002.
[4] HASPELMATH M. Against markedness (and what to replace it with)[J]. Journal of Linguistics, 2006, 42(1): 25–70. DOI:10.1017/S0022226705003683
[5] FLOWERDEW J, LI Y. Language re-use among Chinese apprentice scientists writing for publication[J]. Applied Linguistics, 2007, 28(3): 440–465. DOI:10.1093/applin/amm031
[6] BENOR S B. Ethnolinguistic repertoire:shifting the analytic focus in language and ethnicity[J]. Journal of Sociolinguistics, 2010, 14(2): 159–183. DOI:10.1111/j.1467-9841.2010.00440.x
[7] LAWRENCE Jun Zhang. A dynamic metacognitive systems account of Chinese university students' knowledge about EFL reading[J]. Tesol Quarterly, 2010, 44(2): 320–353. DOI:10.5054/tq.2010.223352
[8] WOODS C. Researching and developing interdisciplinary teaching:towards a conceptual framework for classroom communication[J]. Higher Education, 2007, 54(6): 853–866. DOI:10.1007/s10734-006-9027-3
[9] HUANG K. More does not mean better:frequency and accuracy analysis of lexical bundles in Chinese EFL learners' essay writing[J]. System, 2015, 53: 13–23. DOI:10.1016/j.system.2015.06.011
[10] ULRICH R, MAIENBORN C. Left-right coding of past and future in language:the mental timeline during sentence processing[J]. Cognition, 2010, 117(2): 126–138. DOI:10.1016/j.cognition.2010.08.001
[11] HAAS M H, CHANCE S A, CRAM D F, et al. Evidence of pragmatic impairments in speech and proverb interpretation in schizophrenia[J]. Journal of Psycholinguistic Research, 2014, 44(4): 1–15.
[12] HAWORTH K. The dynamics of power and resistance in police interview discourse[J]. Discourse & Society, 2006, 17(6): 739–759.
[13] MIHALCEA R, STRAPPARAVA C. Learning to laugh (automatically):computational models for humor recognition[J]. Computational Intelligence, 2006, 22(22): 126–142.
[14] ARGAMON S, DODICK J, CHASE P. Language use reflects scientific methodology:a corpus-based study of peer-reviewed journal articles[J]. Scientometrics, 2008, 75(2): 203–238. DOI:10.1007/s11192-007-1768-y
[15] 邱均平. 文献计量学[M]. 北京: 科学技术文献出版社, 1988.
[16] HARVEY K J, BROWN B, CRAWFORD P, et al. 'Am I normal?' Teenagers, sexual health and the internet[J]. Social Science & Medicine, 2007, 65(4): 771–781.
[17] KOSTOFF R N, BRIGGS M B, RUSHENBERG RL, et al. Chinese science and technology-structure and infrastructure[J]. Technological Forecasting and Social Change, 2006, 72(7): 798–814.
[18] BERGEN B K, LINDSAY S, MATLOCK T, et al. Spatial and linguistic aspects of visual imagery in sentence comprehension[J]. Cognitive Science, 2007, 31(5): 733–764. DOI:10.1080/03640210701530748
[19] FIEZ J A, TRANEL D, SEAGER-FRERICHS D, et al. Specific reading and phonological processing deficits are associated with damage to the left frontal operculum[J]. Cortex, 2006, 42(4): 624–643. DOI:10.1016/S0010-9452(08)70399-X
[20] BELCHER D D. Seeking acceptance in an English-only research world[J]. Journal of Second Language Writing, 2007, 16(1): 1–22. DOI:10.1016/j.jslw.2006.12.001
[21] 王梅英, 刘雪立, 王璞. h指数在期刊评价中的地位和作用[J]. 中国科技期刊研究, 2012, 23(3): 387–390.