南京农业大学学报  2018, Vol. 41 Issue (6): 1133-1141   PDF    
http://dx.doi.org/10.7685/jnau.201809016
0

文章信息

唐惠燕, 倪峰, 李小涛, 陈蓉蓉, 袁曦临, 朱艳, 周济, 丁艳锋
TANG Huiyan, NI Feng, LI Xiaotao, CHEN Rongrong, YUAN Xilin, ZHU Yan, ZHOU Ji, DING Yanfeng
基于Scopus的植物表型组学研究进展分析
Analysis of the advance in plant phenomics research based on Scopus tools
南京农业大学学报, 2018, 41(6): 1133-1141
Journal of Nanjing Agricultural University, 2018, 41(6): 1133-1141.
http://dx.doi.org/10.7685/jnau.201809016

文章历史

收稿日期: 2018-09-10
基于Scopus的植物表型组学研究进展分析
唐惠燕1 , 倪峰1 , 李小涛3 , 陈蓉蓉1 , 袁曦临4 , 朱艳2 , 周济5,6 , 丁艳锋2     
1. 南京农业大学图书馆, 江苏 南京 210095;
2. 南京农业大学植物表型组学研究中心, 江苏 南京 210095;
3. 南京航空航天大学图书馆, 江苏 南京 211106;
4. 东南大学图书馆, 江苏 南京 210096;
5. Earlham Institute, Norwich Research Park, Norwich, NR4 7UZ, UK;
6. University of East Anglia, Norwich Research Park, Norwich, NR4 7TJ, UK
摘要[目的]文献计量方法可以用于反映和预测科学技术发展的历史和趋势。本文基于科学大数据的计量方法探讨植物表型组学的研究现状,为植物表型组学的发展提供参考。[方法]基于Scopus数据库,分析2013年—2018年9月数据库中植物表型组学及其相关学术产出的文献数量、引用次数、合作单位、研究方向、学术机构和科研团队等信息,利用SciVal和CiteSpace 5.0等统计分析工具,运用可视化数据方法,分析植物表型组学研究领域的发展特点和趋势。[结果]基于Scopus共检索到与植物表型组学研究和应用相关的文献共20 953篇,总被引数217 105,TOP1%高被引论文为2.0%。相关学术产出总被引量TOP10的国家是美国、中国、德国、英国、法国、日本、澳大利亚、西班牙、加拿大和荷兰。相关论文被引总量TOP10的机构分别是中国科学院、法国国家农业研究院、美国农业部、法国国家科学研究院、中国农业科学院、美国康奈尔大学、西班牙高等科学研究委员会、美国加州大学戴维斯分校、法国巴黎萨克莱大学、荷兰瓦赫宁根大学。学术产出最多的学者是德国克斯·普朗克分子植物生理研究所的Alisdair Robert Fernie,共发表58篇植物细胞表型论文,被引1 246次。目前植物表型组学研究的植物种类较少,主要包括拟南芥、水稻、小麦、玉米、番茄和大豆。[结论]作为一个新兴的研究方向,植物表型组学体现出作物栽培、育种、生物学与计算机科学等多学科交叉发展的特性。高通量图像及相关数据分析是现阶段植物表型组学的重要研究方向,主题显著度指数达到98.8%,受关注度极高。
关键词植物表型组学   文献计量学   Scopes   可视化   主题显著度   CiteSpace   
Analysis of the advance in plant phenomics research based on Scopus tools
TANG Huiyan1, NI Feng1, LI Xiaotao3, CHEN Rongrong1, YUAN Xilin4, ZHU Yan2, ZHOU Ji5,6 , DING Yanfeng2    
1. Library of Nanjing Agricultural University, Nanjing 210095, China;
2. Plant Phenomics Research Center, Nanjing Agricultural University, Nanjing 210095, China;
3. Library of Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China;
4. Library of Southeast University, Nanjing 210096, China;
5. Earlham Institute, Norwich Research Park, Norwich, NR4 7UZ, UK;
6. University of East Anglia, Norwich Research Park, Norwich, NR4 7TJ, UK
Abstract: [Objectives] Bibliometric analyses are capable of demonstrating the history and the tendency of scientific and technological development. This article aims to use big scientific data to explore the present status of plant phenomics, based on which sound recommendations could be provided for the development of this emerging research domain. [Methods] Based on academic outputs such as research publications, citations, collaborations, research areas, academic organizations, and authors retrieved from the Scopus database between 2013 and September 2018, statistical analysis tools such as SciVal and CiteSpace 5.0 were applied to quantitatively visualize the development and tendency of plant phenotyping, plant phenomics, and related research areas. [Results] This Scopus-based research has retrieved 20 953 articles that are related to plant phenotyping, plant phenomics, and related applications in plant research, with a total citation of 217 105 and 2.0% of them are TOP1% highly cited papers. According to total citations, the TOP10 countries are the United States, China, Germany, the United Kingdom, France, Japan, Australia, Spain, Canada, and the Netherlands. The TOP10 research organizations based on total citations are Chinese Academy of Sciences (CAS), Institut National de la Recherche Agronomique (INRA), the US Department of Agriculture, Centre National de la Recherche Scientifique (CNRS), Chinese Academy of Agricultural Sciences, Cornell University, Spanish National Research Council, University of California at Davis, Universite Paris-Sacly, and Wageningen University & Research. The scholar with the most academic outputs is Alisdair Robert Fernie at the Koch Planck Institute of Molecular Plant Physiology, Germany. He has published 58 papers using plant cellular phenotypes and was cited 1 246 times. At present, plant phenomics research has focused on a number of plant species, including Arabidopsis, rice, wheat, corn, tomato and soybean. [Conclusion] As an emerging research domain, plant phenomics requires interdisciplinary efforts to integrate agriculture, cultivation, breeding, and other plant biological research with computing sciences. In particular, high-throughput image analysis and related data analysis has become an important research theme at the present stage, with the topical saliency index reaches 98.8%, a very high relevance score.
Keywords: plant phenomics    bibliometrics    Scopus    visualization    topic prominence index    CiteSpace   

表型组学是一门研究生物个体或群体, 在特定条件下(如各类环境和生长阶段等)所表现出的可观察的形态特征及其变化规律的学科[1-2]。该研究领域近年来发展较快, 特别是针对人、动物和植物单一或系列表型的研究已经受到学术界和业界的广泛关注[3-5]。目前, 表型组学在作物育种和农业研究中的作用已获得普遍认可, 植物表型组学正在成为植物基因组功能分析、分子育种和农业应用中的重要技术支撑[6-11]

科技文献是科学研究成果的主要表现形式和载体。科技文献数量和结构变化以及相互引用、相互促进的规律反映了相应科技领域的发展特征[12]。因此, 文献计量方法可以反映和预测科学技术发展的历史和趋势。目前, 文献计量学的理论和方法已经被广泛应用于科研绩效评价、学科评估等领域[13-15]

高水平学术成果的数量和质量是衡量该领域科学技术研究水准的重要指标。为了量化分析植物表型组学研究的现状, 本文基于Scopus数据库对植物表型组学领域学术产出的文献数量、引用次数、合作单位、研究方向、学术机构和科研团队等信息进行大数据量化分析, 通过可视化展示植物表型组学领域的研究现状, 为植物表型组学的发展方向提供参考。

1 数据来源与计量评价指标 1.1 数据来源及分析工具

Scopus是爱思唯尔出版社于2004年推出的文摘引文数据库[16], 收录全球5 000余家出版社的23 000余种同行评议期刊、75 000多册图书以及500万多篇会议论文, 也包括一些非英语国家和地区的文献资源。文献引文可追溯至20世纪70年代, 并且每日更新。爱思唯尔出版社提供的SciVal研究分析工具可以从跨学科的角度揭示科研绩效的产出, 通过共引聚类原理和可视化数据分析, 量化比较全球8 500多个研究机构和220个国家的Scopus数据库中近6年数据。

本文基于Scopus数据库检索植物表型组学相关的研究成果, 主要包括学术论文、专著、专利等学术产出, 利用SciVal平台重点分析2013年—2018年9月植物表型组学应用及相关方法研究的论文及专著等学术产出类型, 主要包括学术论文产出量、合作和影响力、重要研究机构和学者、热点主题等内容[17]。科研团队合作情况则利用Scopus数据输出功能, 导入到CiteSpace 5.0工具进行分析[18]。由于专利成果的复杂性, 针对专利的详细分析将作为本研究的后续工作。

检索用的一级关键词包括:phenomics、phenotyping、phenotype、image analysis; 二级关键词包括:plants、crops, 检索时间:2018年9月。

1.2 计量评估指标

从学术角度分析植物表型组学的研究现状, 所选用的主要评估指标见表 1

表 1 主要评估指标及说明 Table 1 Main assessment indicators indices and explanations
编号
Number
指标类型
Index type
说明及用途
Explanation and use
1 学术产出类型和数量 主要包括学术产出类型比例及不同类型的数量, 如文献数量、专利数量。
2 学术产出引用情况 包括总被引数、单篇被引数、TOP1%高被引论文比例、TOP10%高被引论文比例等。
3 归一化文献引用次数 通过归一化消除不同学科差异性, 用于评价学术产出质量情况, 国际平均值为1。
4 H指数 用于评价学者发文量与引用情况的指标, 包括H指数、H5指数等。
5 合作情况 用于评价国家、机构、学者层面合作的类型, 包括国际合作比例、国内合作比例、机构内合作比例等。
6 参与学者数 产出的学术成果中参与的学者数量。
7 主题显著性指数 用于评价主题被关注程度。爱思唯尔采用直接引用聚类方法将整个科学领域的主题一次识别, 共得到9.6万个科学主题, 每个主题都计算出主题显著性指数。
8 不同学科领域占比 用于评价领域的多学科性特征, Scopus共包含27个学科领域和334个子领域。
9 引用分 期刊引用情况的指标, 类似于期刊影响因子。
2 统计结果与分析 2.1 植物表型组学学术产出及分布情况

基于Scopus共检索到与植物表型组学研究和应用相关的文献共51 618篇, 其中研究型期刊论文44 950篇, 占87.1%;综述型期刊论文2 709篇, 占5.2%;还包括会议论文、图书等, 时间跨度为1935年—2018年9月。学科范围涵盖了Scopus 27个研究领域中的26个领域, 体现出植物表型组学广泛的应用领域和多学科交叉发展的特性, 其中农业与生物科学领域31 642篇, 占61.3%;生物化学、遗传学和分子生物学领域31 154篇, 占60.3%;计算机科学领域1 867篇, 占3.6%。

本文根据不同时期相关文献的数量情况, 把植物表型组学研究的发展大致分成4个阶段。第1阶段, 1935—1968年, 共50篇文献, 年发文量 < 10篇, 年均1.5篇; 第2阶段, 1969—1984年, 共635篇文献, 年发文量 < 100篇, 年均39.7篇; 第3阶段, 1985—2000年, 共10 062篇文献, 年发文量 < 1 000篇, 年均628.9篇; 第4阶段, 2001年—2018年9月, 共发文36 538篇, 年均2 029.9篇。本文对2013年—2018年9月植物表型组学学术产出情况进行了详细的统计分析, 结果见表 2

表 2 2013年—2018年9月植物表型组学相关学术产出情况 Table 2 Statistics of plant phenomics related academic outputs between 2013 and September 2018
指标类型
Index type
2013 2014 2015 2016 2017 2018 合计/平均
Total/mean
文献数量Number of publications 3 562 3 746 3 821 4 076 3 937 1 811 20 953
总被引数Total citations 76 263 59 243 43 206 27 550 9 945 898 217 105
篇均被引数Average citations per paper 21.4 15.8 11.3 6.8 2.5 0.5 10.4
归一化文献引用次数field-weighted citation impact(FWCI) 1.5 1.49 1.42 1.46 1.33 1.43 1.44
TOP1%高被引论文比例/% The proportion of TOP1% of highly cited publications(TOP1%HCP) 2.9 2.1 2.0 1.8 1.3 1.7 2.0
TOP10%高被引论文比例/% The proportion of TOP10% of highly cited publications(TOP10%HCP) 30.2 27.8 25.4 25.1 23.7 30.4 26.7
国际合作比例/% The proportion of international collaborations 34.4 33.8 35.3 34.9 34.2 34.3 34.5
参与学者数The number of involved scholars 17 881 19 286 20 002 21 795 21 499 9 889 80 330
专利数量Number of patents [19] 349 344 260 276 190 31 1 733

表 2可以看出:植物表型组学及相关研究经历了长时间的积累, 近年来的文献数量仍呈不断上升趋势, 参与的学者数量也在继续增加, 目前已有超过2万名科研人员参与植物表型组学研究。从归一化文献引用次数(field-weighted citation impact, FWCI)可以看出论文整体质量较高, 2013年—2018年9月发文的FWCI达到1.44, 远高于世界平均水平1, TOP1%高被引论文比例2.0%, TOP10%高被引论文比例达到26.7%, 这些数据均说明植物表型组学研究具有较高的科研水平。另外, 近5年植物表型组学专利申请量与发表文献数量相比并未呈现同步增长的趋势, 表明目前植物表型组学研究还处于基础和理论研究阶段。

表 3可知:从学术产出归属国家和地区分布来看, 欧美和东亚发文量和引用率都处于世界前列。其中美国、中国、德国是文献数量和总被引数均排前三的国家, 相比较而言, 美国发文数量和总被引数均排世界第一, 中国发文数量比美国略少, 但总被引情况还有待提升。从FWCI看, 部分西欧国家(特别是英国、法国、德国)以及日本、澳大利亚等国家发表了很多高影响力的学术成果。在中国, 北京产出的植物表型组学及相关研究文献最多, 南京、武汉、杭州等地也是重要的产出区。

表 3 2013—2017年植物表型组学相关学术产出被引总量TOP10国家 Table 3 TOP10 countries ranked by total citations of plant phenomics related academic outputs between 2013 and 2017
国家
Country
发文数
Number of publications
被引总量
Total citations
篇均被引数
Average citations per paper
归一化文献引用次数
FWCI
TOP10%高被引论文比例/%
The proportion of TOP10%HCP
USA 5 106 78 420 15.36 1.82 35.1
China 4 658 49 247 10.57 1.36 25.9
Germany 1 873 28 840 15.40 2.00 38.7
Britain 1 326 23 312 17.59 2.07 41.4
France 1 386 20 099 14.50 1.88 35.2
Japan 1 236 16 470 13.33 1.49 28.5
Australia 971 15 466 15.93 2.00 37.6
Spain 949 13 416 14.14 1.81 32.3
Canada 782 11 216 14.34 1.70 29.8
Netherlands 469 9 034 19.26 2.27 42.0

表 4可见:在被引总量TOP10机构名单中, 美国和法国有3个机构入选, 中国有2个机构入选。其中中国科学院共发文835篇, 被引13 137次, 均位列世界第一, 中国农业科学院共发文695篇, 被引8 195次, 位列世界第五, 2个机构的篇均被引和TOP10%高被引论文比例均相对较高, 可以看出在植物表型组学领域的应用和研究, 中国已经具备巨大的潜力, 走在了世界的前列。

表 4 2013—2017年植物表型组学相关论文被引总量TOP10机构 Table 4 TOP10 research organizations ranked by total citations of plant phenomics related academic outputs between 2013 and 2017
研究机构
Research organizations
被引总数
Totalcitations
发文数
Number ofpublications
归一化文献引用次数
FWCI
TOP10%高被引论文比例/%
The proportion ofTOP10%HCP
国际合作比例/%
The proportion ofinternational collaborations
Chinese Academy of Sciences 13 137 835 1.75 36.8 39.8
INRA(Institut National de laRecherche Agronomique) 10 366 755 1.88 35.5 64.8
United States Department of Agriculture 9 943 778 1.70 30.7 49.4
CNRS(Centre National de la Recherche Scientifique) 9 396 592 2.00 39.0 69.3
Chinese Academy of Agricultural Sciences 8 195 695 1.53 29.6 28.5
Cornell University 7 921 362 2.56 48.3 64.4
Spanish National Research Council 6 827 440 2.06 37.3 62.0
University of California at Davis 5 643 315 1.93 41.3 62.5
Universite Paris-Saclay 5 286 329 2.04 42.2 68.7
Wageningen University & Research 5 273 296 2.09 41.2 73.6

表 5可见:德国克斯·普朗克分子植物生理研究所Alisdair Robert Fernie发表58篇植物细胞表型论文, 被引1 246次, 在被检索的所有学者中排名第一, 其H指数和H5指数均非常高, 是一位高产的研究工作者。另外, 因为使用了表型组学的方法开展研究, 中国农业科学院的Wan Jianmin(万建民)、Guo Xiuping(郭秀萍)和中国科学院的Li Jiayang(李家洋)都进入TOP10学者名单。

表 5 2013—2017年植物表型组学相关学术产出较多的学者 Table 5 Scholars with relatively high academic outputs in plant phenomics and related research between 2013 and 2017
学者姓名
Scholar name
归属机构
Affiliated organizations
被引总数
Totalcitations
发文数
Number ofpublications
归一化文献引用次数
FWCI
H5指数
H5 index
H指数
H index
TOP10%高被引论文比例/%
The proportionof TOP10%HCP
Alisdair Robert Fernie Max-Planck-Institut fur molekulare Physiologie 1 246 58 2.37 32 97 58.6
Susan R. McCouch Cornell University 1 230 24 5.19 18 74 83.3
Ed Buckler Cornell University 1 189 33 3.46 23 66 75.8
Detlef Weigel Max Planck Institute for Developmental Biology 999 25 5.09 28 101 76.0
Wan Jianmin Chinese Academy ofAgricultural Sciences 956 55 1.72 19 41 36.4
Li Jiayang Institute of Genetics and Developmental Biology Chinese Academy of Sciences 869 16 6.24 22 51 100.0
Rajeev Kumar Varshney International Crops Research Institute for the Semi-Arid Tropics 791 40 2.28 27 62 47.5
Gustavo deLos Campos Michigan State University 789 12 3.98 13 28 75.0
Jean Luc Jannink Cornell University 777 24 3.88 19 39 70.8
Guo Xiuping Chinese Academy ofAgricultural Sciences 745 31 2.11 17 27 48.4
Jiang Ling Nanjing Agricultural University 721 32 1.96 16 32 40.6
2.2 植物表型组学学术产出合作情况

学术产出的合作包括国际合作、国内合作、机构内合作3种类型。2013—2017年间植物表型组学研究的这3种合作方式占97.2%, 只有2.8%属于无合作方式, 由单个学者完成的学术成果, 这说明合作是植物表型组学领域研究的主要方式。从图 1可见:植物表型组学研究的国际合作比例远高于其他学科国际合作的平均比例, 机构内合作比例却低于其他学科的平均比例。说明学术合作已逐渐成为全球植物表型组学领域的研究基础, 而且国际间的合作也提升了该领域的学术产出水平(表 6)。

图 1 植物表型组学研究的合作与学术产出国际合作的比较 Figure 1 The collaboration status between plant phenomics related research and other research domains
表 6 2013—2017年植物表型组学相关研究论文合作情况 Table 6 Academic publications in plant phenomics related research based on collaborative research between 2013 and 2017
合作类型
Collaboration type
比例/%
Ratio
发文数
Number ofpublications
总被引数
Totalcitations
篇均引用数
Average citationsper paper
归一化文献引用次数
FWCI
国际合作International collaboration 34.5 6 593 93 605 14.2 1.82
国内合作National collaboration 29.6 5 651 58 839 10.4 1.35
机构内合作Institutional collaboration 33.1 6 320 52 762 8.3 1.14

学术产出的合作数据也可以反映不同科研团队的合作程度。图 2是植物表型组学及其相关领域学术产出TOP20学者合作网络图, 基于Scopus导出数据, 利用CiteSpace 5.0工具绘制科研团队合作图谱, 可视化展示学者学术产出情况以及相互间合作关系。图 2中包括TOP20及其合作者共210个节点, 因篇幅限制, 只显示文献数量相对较多的节点。各节点的大小代表作者文献数量的多少, 数量越多节点越大; 节点之间的连线表示在文献中的共现关系, 其粗细表明共现的强度, 颜色则对应节点第1次共现的时间; 图中颜色由冷色调到暖色调的变化对应发表年份由远及近。图 2揭示植物表型组学及相关研究已经形成一定规模的合作网络。比如, 以万建民、江玲和张欣等学者为核心的科研团队构成了图 2中最大的合作子网, 显示出中国农业科学院与南京农业大学密切的合作关系。国外的主要研究团队规模则相对较小, 如A.R.Fernie、R.K.Varshney等学者发文量进入了该领域的TOP10, 但跨团队协作规模不大。

图 2 2013—2017植物表型组学及相关研究领域学术产出TOP20学者合作图 Figure 2 Collaborative mapping of TOP20 scholars in plant phenomics related research between 2013 and 2017 各节点的大小代表作者文献数量的多少,数量越多节点越大;节点之间连线的粗细表明共现的强度,图中颜色由冷色调到暖色调的变化对应发表年份由远及近。 The size of each node represents the number of articles published by a given author. The more publications, the larger the node. The thickness of connections between these nodes indicates the strength of co-occurrence; and the color change(i.e. from cool to warm tone)corresponds to the year of the publication.
2.3 植物表型组学学术产出载体情况

虽然植物表型组学是一个多学科交叉发展的研究方向, 但论文多发表在农业与生物学期刊上, 发文比较分散。从表 7可以看出:2013—2017年间《PLoS One》是植物表型组学及相关研究领域发文最多的期刊, 共发表1242篇研究论文。而植物表型组学领域的高水平论文主要发表在《Plant Cell》《New Phytologist》和《Plant Physiology》等期刊上, TOP10%高被引论文比例分别达到68.7%、59.6%和54.2%。

表 7 2013—2017年发表植物表型组学及相关研究论文数量TOP10的期刊 Table 7 TOP10 journals publishing plant phenomics related research papers between 2013 and 2017
期刊名
Journal name
发文数
Number ofpublications
引用分
Citescore
篇均被引数
Average citationsper paper
归一化文献引用次数
FWCI
TOP10%高被引论文比例/%
The proportion ofTOP10%HCP
PLoS One 1 242 3.01 10.82 1.25 20.7
Plant Physiology 666 6.01 17.02 2.14 54.2
Theoretical and Applied Genetics 504 4.42 12.09 1.66 29.8
Journal of Experimental Botany 492 5.78 14.36 1.70 36.8
Frontiers in Plant Science 468 4.14 8.24 1.61 23.7
Plant Journal 389 6.01 18.22 1.98 48.6
New Phytologist 354 6.65 18.08 2.67 59.6
Plant Cell 297 7.33 26.2 2.88 68.7
BMC Genomics 293 4.08 12.03 1.38 30.7
Scientific Reports 288 4.36 9.21 0.88 28.8
2.4 植物表型组学研究主题热点分析 2.4.1 研究热词图谱分析

利用SciVal提供的科学主题显著性研究模块对植物表型组学2013年—2018年9月共发表的20 953篇论文进行主题词分析。首先使用爱思唯尔的“指纹技术”(FingerPrint)[20]提取文献题目和摘要里出现的TOP50主题词, 并加以归并和处理, 最后画出主题图谱(图 3)。图 3中包括了2013年—2018年9月所有学术产出的研究热词图谱, 以及2013、2015、2017年的研究热词图谱。其中, 绿色代表发文增加, 蓝色代表发文减少, 灰色代表基本持平, 字体越大代表与植物表型组学的关联性越强, 字体的位置是随机的。从图 4可以看出植物表型组学研究的主题特征和变化趋势, 出现最多的主题词包括数量性状基因座(quantitative trait loci)、特征(traits)、突变体(mutants)、基因表达调控(gene expression regulation)、表现型(phenotype)、干旱(droughts)、抗病性(disease resistance)、图像分析(image analysis)等, 与作物品种相关联的词包括拟南芥(Arabidopsis)、植物(plants)、水稻(rice、Oryza sativa)、小麦(Triticum、wheat)、玉米(Zea mays)等。通过对2013、2015、2017年热词图谱进行对比, 可以看出植物表型组学研究的主题变化。2013年主要以拟南芥为主, 研究拟南芥蛋白、数量性状基因座、基因表达等, 这些主题词呈现逐渐减少的趋势; 2015年除了拟南芥, 又出现了水稻、小麦等作物表型的研究; 2017年研究水稻表型的不断增多, 在研究手段上“图像分析”出现较多, 目前还处于不断增加的趋势。

图 3 2013年—2018年9月植物表型组学及相关研究热词图谱 Figure 3 Top keyword maps of plant phenomics and related research fields between 2013 and September 2018 绿色代表发文增加,蓝色代表发文减少,灰色代表基本持平,字体越大代表与植物表型组学的关联性越强。 Green represents increasing in publications; blue represents decreasing in publications; and gray represents publication reaching a plateau or slow growth. The larger the font, the stronger the connection with plant phenomics.
图 4 2013—2017年植物表型组学不同植物学术产出量 Figure 4 Different plant model species studied in plant phenomics related publications between 2013 and 2017
2.4.2 主题显著度分析

Elsevier公司研究人员基于Scopus数据库采用Topic of Prominence模型[21]从全球范围内聚类成96 000个研究主题方向。从中筛选与植物表型组学相关的研究主题, 经过匹配只得到1个研究方向与植物表型组学相关, 这个主题是“植物表型组学高通量图像和数据分析”, 主题显著度指数达到98.8%, 发表在TOP10%期刊上文献比例达52.8%, 说明这个研究方向与表型组学研究有极强的关联性。基于图像和大数据的分析方法获取有实际生物学意义的信息是表型组学的研究重心[1]。通过构建植物表型组学研究热词图谱, 出现了很多与计算机科学领域相关的词, 包括软件树冠方法学、计算机断层扫描、图像处理、计算机辅助等, 体现出信息学科与农业学科交叉性的特点。

2.5 植物表型组学研究的植物类型分布

将与植物种类相关的主题词进行归并, 筛选出相对较多的植物种类, 与水稻相关主题包括rice、Oryza sativa等, 与小麦相关的主题词包括wheat、Triticum等。从检索结果(图 4)看, 目前植物表型组学研究的植物种类较少, 主要包括拟南芥(Arabidopsis)、水稻(rice)、小麦(wheat)、玉米(Zea mays)、番茄(tomato)和大豆(soybean)。拟南芥作为重要的模式植物, 2014年以前拟南芥的表型组学文献数量超过了其他植物种类的总和, 此后呈下降的趋势。水稻的表型组学文献数量占第2位, 而且学术产出相对稳定。近几年,针对小麦表型组学的研究文献也呈增加趋势。水稻和小麦表型组学研究整体学术产出总量每年不到1 000篇, 而水稻和小麦每年总学术产出总量在15 000篇左右, 可以看出目前植物表型组学研究还处于新兴阶段。

3 讨论

表型信息获取与分析是植物功能基因组学和现代作物育种研究的基础。长期以来, 对于表型的研究一直停留在传统人工获取阶段, 劳动量大, 效率低, 对大批量植物样本的生长测量几乎是不可行的; 同时表型数据的质量受人工主观因素的影响也比较大。植物表型的研究经历了相对较长的发展过程, 本文的数据也说明了这个情况, 从1935年到1984年植物表型研究领域以论文为主体的学术产出总量年均不足100篇。计算机和网络技术的快速发展为表型组学研究提供了新方法。近10年植物表型组学相关研究论文数量从2 000篇增加到4 000篇, 逐渐成为研究热点, 并且出现了各种专业化的表型测量平台[22]。植物表型的研究已由单纯的农业学科研究演变成由农业、自动控制、光学成像、图像分析及计算机技术等多领域多学科共同关注的研究方向, 多领域的深度合作给作物育种学科的发展带来革命性的推动作用。

目前, 植物表型组学研究是一个新兴的研究领域, 以学术论文为主体的学术产出总量还不是很多。研究主题体现出农业、栽培、育种、生物学与计算机科学等多学科交叉发展的特性。高通量图像和数据分析是现阶段植物表型组学的重要研究方向, 主题显著度指数达到98.8%, 受关注度较高。现阶段植物表型组学研究主要植物种类包括拟南芥、水稻、小麦和玉米等。

虽然植物表型组学研究已经呈现多学科合作发展的趋势, 但植物科学还是主体领域。在世界范围内, 美国、中国、德国等国家实力较强。中国科学院是学术产出数量最多也是引用总量最多的研究机构, 同时中国农业科学院、中国农业大学、南京农业大学等8个机构占据植物表型组学学术产出TOP20的地位, 可以看出植物表型组学及相关技术已逐渐为各类植物研究团队所接受, 而且中国对植物表型组学研究和相关应用已处于世界前列。

本文针对植物表型组学领域主题词的聚类分析只获取到“高通量图像和数据分析”一个热点, 显示出目前大量已发表的植物表型组学研究手段相对单一。现阶段图像识别、机器学习、自动驾驶等人工智能技术已经深入影响并改变着人类的生活方式[23]。因此, 植物表型组学的研究也应该积极寻求与其他领域的合作, 由多领域共同合作推动该学科的发展。从相关的研究综述可以看出, 植物表型组学正在向如何把海量图像和传感器数据转化为真正有意义的生物学知识方向探索[1, 24]。在完善大规模、高通量表型数据采集环节的基础上, 使用全新的大数据分析方法对表型数据集进行数据标注、标准化、动态存储和优化整合, 通过引入机器学习算法, 在大数据中提取可靠的植物性状信息成为植物表型组学今后的发展趋势。由于表型分析需要开发团队具备数学、算法、软(硬)件和生命科学等多方面的专业背景, 因此, 来自不同学科的各个科研团队之间的长期合作是表型组学必不可少的发展基础。另外, 基于大数据的植物表型组学研究不同于以往的实验室研究, 在开放环境下如果不注意数据安全和管理将会出现数据质量和保存等方面的问题。因此, 在研究过程中还需要数据领域专家共同参与合作。

现在不同国家和地区的研究团队在植物表型组学研究中的侧重点各不相同。比如, 德国注重大规模、可扩展的表型数据采集技术和基于自动化的数据分析方法; 荷兰注重室内植物表型自动化筛分系统以及可控环境中的植物形态特征分析; 法国在结合表型和作物遗传育种研究的基础上, 偏重于室内外植物环境动态互作分析和生长预测建模; 英国对遥感技术和基于机器学习的计算机视觉、图像分析的表型分析十分重视; 日本则对小型、高精度的定性分析有较大的科研投入; 而澳大利亚的表型研究主要针对各类田间作物的系列生长表型, 并开发了一系列技术手段[25-28]。中国在植物表型组领域的研究应结合我国植物研究和农业生产的实际情况, 在吸收其他国家经验的基础上, 掌握关键技术, 加速从实验走向实际应用。

植物表型组学研究的学术产出以期刊文献为主, 所有学术产出在几个主要相关学科中均处于较高水平。国际合作较多, 且国际合作提升了学术产出的水平。大部分学术论文发表在与植物与生物学相关的期刊上, 其中《Plant Cell》《New Phytologist》和《Plant Physiology》是发文较多且论文质量较高的期刊。然而,大部分学术论文发表在与农学、生物学相关的期刊上, 这种情况不利于调动其他领域专家参与的积极性。因此, 增加植物表型组学研究相关的出版载体将加快该领域的发展, 有利于植物表型组学研究的传播和交流。2018年南京农业大学与Science合作创办英文期刊《Plant Phenomics》, 这将有利于推动植物表型组学的快速发展。

Elsevier公司靳辉先生给予帮助, 谨致谢意。

参考文献(References)
[1]
周济, Tardieu F, Pridmore T, 等. 植物表型组学:发展、现状与挑战[J]. 南京农业大学学报, 2018, 41(4): 580-588.
Zhou Ji, Tardieu F, Pridmore T, et al. Plant phenomics:history, present status and challenges[J]. Journal of Nanjing Agricultural University, 2018, 41(4): 580-588 (in Chinese with English abstract). DOI:10.7685/jnau.201805100
[2]
Gowen C M, Fong S S. Phenome analysis of microorganisms[J]. Bioinformatics, 2009, 79(10): 279-292.
[3]
Niculescu A B, Kelsoe J R. Finding genes for bipolar disorder in the functional genomics era:from convergent functional genomics to phenomics and back[J]. CNS Spectrums, 2002, 7(3): 215-216.
[4]
Finkel E. With "Phenomics", plant scientists hope to shift breeding into overdrive[J]. Science, 2009, 325(5939): 380-381.
[5]
李宏, 韦晓兰. 表型组学:解析基因型-表型关系的科学[J]. 生物技术通报, 2013(7): 41-47.
Li H, Wei X L. Phenomics:a science of unravelling the genotype-phenotype relationship[J]. Biotechnology Bulletin, 2013(7): 41-47 (in Chinese with English abstract).
[6]
Pieruschka R, Poorter H. Phenotyping plants:genes, phenes and machines introduction[J]. Funct Plant Biol, 2012, 39: 813-820.
[7]
Tester M, Langridge P. Breeding technologies to increase crop production in a changing world[J]. Science, 2010, 327(5967): 818-822.
[8]
Yang W, Duan L, Chen G, et al. Plant phenomics and high-throughput phenotyping:accelerating rice functional genomics using multidisciplinary technologies[J]. Curr Opin Plant Biol, 2013, 16: 180-187.
[9]
Dhondt S, Wuyts N, Inze D. Cell to whole-plant phenotyping:the best is yet to come[J]. Trends Plant Sci, 2013, 18: 433-444.
[10]
White J W, Andrade-Sanchez P, Gore M A, et al. Field-based phenomics for plant genetics research[J]. Field Crops Res, 2012, 133: 101-112. DOI:10.1016/j.fcr.2012.04.003
[11]
潘映红. 论植物表型组和植物表型组学的概念和范畴[J]. 作物学报, 2015, 41(2): 175-186.
Pan Y H. Analysis of concepts and categories of plant phenome and phenomics[J]. Acta Agronomica Sinica, 2015, 41(2): 175-186 (in Chinese with English abstract).
[12]
邱均平. 信息计量学:第二讲文献信息增长规律与应用[J]. 情报理论与实践, 2000, 23(2): 153-157.
Qiu J P. Informetrics:second talk regularity and application of document information growth[J]. Intelligence Theory and Practice, 2000, 23(2): 153-157 (in Chinese). DOI:10.3969/j.issn.1000-7490.2000.02.026
[13]
马春晖, 张南, 周晓丽, 等. 基于Scopus和Scival的国内外高校食品科学研究现状分析[J]. 食品科学技术学报, 2016, 34(4): 54-60.
Ma C H, Zhang N, Zhou X L, et al. Analysis of research status of food science basing on Scopus and Scival[J]. Journal of Food Science and Technology, 2016, 34(4): 54-60 (in Chinese with English abstract).
[14]
马春晖, 戴岳, 张南. 基于文献计量学的高分子材料领域研究现状及热点分析[J]. 中国塑料, 2017, 31(6): 8-15.
Ma C H, Dai Y, Zhang N. Research status and hot spots of polymer materials based on literature metrology[J]. China Plastics, 2017, 31(6): 8-15 (in Chinese with English abstract).
[15]
孙颉. 基于文献计量的国内外柿研究现状分析[J]. 果树学报, 2017, 34(6): 706-714.
Sun J. Current situation of persimmon science and technology in the world based on bibliometrics analysis[J]. Journal of Fruit Science, 2017, 34(6): 706-714 (in Chinese with English abstract).
[16]
Scopus Official Website[EB/OL].[2018-09-26]. http://www.scopus.com.
[17]
SciVal Official Website[EB/OL].[2018-09-26]. http://www.scival.com.
[18]
侯剑华, 胡志刚. CiteSpace软件应用研究的回顾与展望[J]. 现代情报, 2013, 33(4): 99-103.
Hou J H, Hu Z G. Review on the application of CiteSpace at home and abroad[J]. Journal of Modern Information, 2013, 33(4): 99-103 (in Chinese with English abstract). DOI:10.3969/j.issn.1008-0821.2013.04.022
[19]
orbit Patent Retrieval Platform[EB/OL].[2018-09-26]. https://www.orbit.com.
[20]
Small H, Boyack K W, Klavans R. Identifying emerging topics in science and technology[J]. Research Policy, 2014, 43(8): 1450-1467.
[21]
Klavans R, Boyack K W. Research portfolio analysis and topic prominence[J]. Journal of Informetrics, 2017, 11(4): 1158-1174.
[22]
段凌凤, 杨万能. 水稻表型组学研究概况和展望[J]. 生命科学, 2016, 28(10): 1129-1137.
Duan L F, Yang W N. Research advances and future scenarios of rice phenomics[J]. Chinese Bulletin of Life Sciences, 2016, 28(10): 1129-1137 (in Chinese with English abstract).
[23]
钟义信. 人工智能的突破与科学方法的创新[J]. 模式识别与人工智能, 2012, 25(3): 456-461.
Zhong Y X. Breakthroughs in artificial intelligence and innovation in methodology[J]. Pattern Recognition and Artificial Intelligence, 2012, 25(3): 456-461 (in Chinese with English abstract). DOI:10.3969/j.issn.1003-6059.2012.03.014
[24]
Daniel R, Frederic B, Claude W, et al. What is cost-efficient phenotyping?Optimizing costs for different scenarios[J]. Plant Science (on line), 2018.
[25]
Furbank R T, Tester M. Phenomics-technologies to relieve the phenotyping bottleneck[J]. Trends Plant Sci, 2011, 16(12): 635-644.
[26]
Fiorani F, Schurr U. Future scenarios for plant phenotyping[J]. Annu Rev Plant Biol, 2013, 64: 267-291. DOI:10.1146/annurev-arplant-050312-120137
[27]
Cendrero-Mateo M P, Muller O, Albrecht H, et al. Terrestrial ecosystem research infrastructures: challenges and opportunities[EB/OL].[2018-10-12]. http://www.crcnetbase.com/doi/10.1201/9781315368252-4.
[28]
Tardieu F, Cabrera-Bosquet L, Pridmore T, et al. Plant phenomics, from sensors to knowledge[J]. Current Biology, 2017, 27(15): 770-783. DOI:10.1016/j.cub.2017.05.055