2. 中国科学院大学, 北京市石景山区玉泉路19号(甲) 100049
2. University of Chinese Academy of Science, 19 Yuquanlu, Beijing 100049, China
数据作为科研成果重要的支撑材料,其可复用的性质让其从长远来看价值可能高于数据所产生的科研成果。科研成果的再现以及相关假设的进一步探索需要获取这些原始数据,数据共享已经成为科研过程中利益相关者关注的焦点。近些年数据的开放获取受到高度重视,越来越多的资助机构及国际学术组织要求科研数据更加公开可获取以帮助验证、推进科学研究,并陆续提出开放数据政策,2007年,经济合作与发展组织(OECD)发表了《公共资助科学数据开放获取的原则和指南》[1]。随后,美国、英国一些重要基金机构也提出了数据开放政策指南,要求科研人员在申请科研项目时必须提供相应的数据管理计划。
受开放获取环境的影响,国外很多期刊出版社制定了数据存缴和出版政策,要求作者在发表论文时按照期刊的数据要求提交科研数据,并将共享原始数据集作为论文发表的条件之一。PLoS(Public Library of Science,公共科学图书馆)期刊,作为开放获取期刊的集合,特别指出开放获取适用于科学文献以及相应的支持数据[2],并在编辑和出版政策中声明:“论文的发表取决于:作者同意他们出版物中描述的任何材料和信息可以免费利用,他人可能会出于学术的、非商业研究的目的合理的请求获取这些材料和信息”[3]。其他几个有影响力的期刊,比如Nature[4]和Science[5],也已经建立了清晰的数据共享政策。此外Nature出版集团还在2014年5月27日推出了在线出版的开放获取杂志“科学数据”(Scientific Data,简称SD),这个杂志要求作者针对数据集进行详细描述,旨在帮助科研人员发布、发现和重用科研数据[6]。
化学作为一门数据产量较大的实验学科,科研过程中产生的数据的生命周期同许多其它数据生命周期[7]一样,由数据的产生、处理、发表、重用几个大的部分组成。数据的产生、处理、重用是科研人员比较熟悉的部分,但数据的发表相对来说较为陌生。化学领域的很多期刊出版商制定了数据共享指南,明确要求作者发表论文时需要同时发表论文数据。因此,期刊的数据发表政策成为科研人员论文发表中必须了解的内容。伴随期刊数据共享政策的推出,为了明确其具体的机制、实施方法和现状,一些学者已经对部分期刊的数据政策作了分析。如国外学者的探讨,Alsheikh-Ali A A等分析了JCR(Journal Citation Reports,期刊引用报告)社会版50种高影响力期刊的数据共享政策并调研了已发论文对政策的遵守情况,发现结果不容乐观,很多论文没有共享数据[8];Piwowar H A等在期刊数据共享政策综述的研究中,分析了期刊数据共享政策的现状以及期刊特点(影响因子、出版商的类型、开放情况)与数据共享政策强度的关系[9];Hrynaszkiewicz I等基于医学期刊数据的发表,制定了数据准备指南,以指导期刊编辑、科研人员和同行评审专家[10]。较国外的研究,国内研究略为薄弱,仅部分学者对期刊数据政策进行了探索。傅天珍、陈妙贞研究了“2013中国最具国际影响力学术期刊”的数据出版政策,发现有数据共享政策的期刊数量较少且以鼓励性政策为主,而且学科分布不均匀[11];吴蓉等以PLoS、Science、PNAS、BMC等期刊为例探索了国外学术期刊数据政策的实施细节,指出我国期刊界在科研数据管理方面还未形成规模,应加强学术论文发表与科研数据共享的有机结合[12];刘晶晶等以自然出版集团推出的数据期刊Scientific Data为例,探索了数据期刊的实施细节和政策要素框架,为国内数据期刊的发展提供参考[13];欧阳铮铮[14]、雷秋雨[15]等都研究了国际代表性数据期刊的出版与发展情况,全面的展示了数据期刊的政策。综合分析国内外研究,多数集中在对期刊数据共享现状及影响因素的研究,较少从贡献数据的科研人员的角度分析。本文旨在系统梳理化学学科领域科学期刊的数据共享政策,通过剖析期刊对科研数据发表的要求,包括数据内容、数据格式、数据共享,找出各期刊在科研数据发表政策方面的共性和差异,让在ACS期刊上发表论文的化学领域科研人员,及时了解ACS期刊对论文中科研数据发表的相关政策和要求,以为化学领域科研人员共享科研数据提供借鉴。对于期刊界,可以推动期刊数据共享政策的实施,同时为国内同类期刊、期刊编辑者制定和完善期刊数据共享政策提供参考。
1 研究对象及数据来源 1.1 研究对象选取化学学科领域学会——美国化学学会(American Chemical Society,ACS)出版的化学期刊作为调研对象,选择ACS的原因主要基于以下两点:第一,在调研中发现美国是科研数据管理实施较好的国家;第二,ACS现已成为世界上最大的科技学会,期刊内容涵盖24个主要的化学研究领域,被ISI的JCR评为“化学领域中被引用次数最多的期刊”。因此在化学领域ACS中的期刊极具代表性和权威性。
1.2 数据来源截至2015年1月16日,ACS出版期刊49种[16],见表1,分别对每种期刊编号,下文如再次出现,将以编号替代。笔者调研了这些期刊的网站,并重点参考了期刊的作者投稿指南(Author Guidelines),指南均为2014年和2015年1月最新修订版本。对于每一种期刊,都详细记录了和数据发表相关的政策,本文所用数据为2015年1月份收集。
![]() |
表 1 ACS期刊列表 |
以ACS期刊投稿指南为数据源,得出如图1所示的ACS数据要求期刊分布情况。其中,Journal of Chemical & Engineering Data是数据期刊(Data Journal),由ACS在1956年推出,主要出版实验和计算所得的数据,期刊的收稿范围包括量子化学中获取的热物理性质、分子模拟、分子力学计算以及实验技术评论等。另一种期刊Accounts of Chemical Research没有数据要求。余下的47种期刊要求作者将数据作为支撑信息(Supporting Information,以下简称SI)提交,SI 指那些阅读论文时不需要但科研人员未来可能需要获取的实验或计算的文档材料,材料包括图表数据、派生数据、实验过程数据,分析和光谱特征数据、光谱、建模坐标和程序以及晶体信息文件等。对于包含序列数据、结构数据、电子显微镜数据、微阵列数据、转基因生物和突变体五类特定类型数据的论文要求将该数据存储到推荐的数据仓储中,47种刊中涉及五类数据的期刊总共有20种。数据论文这种特殊的数据发表形式,本文不作详细论述,下文主要对47种期刊科研数据发表政策中的SI以及其中20种刊的特定数据类型的数据存储政策展开讨论,便于科研人员快速掌握ACS期刊数据政策的共性和差异。
![]() |
图 1 ACS期刊数据要求分布情况 |
ACS 期刊鼓励论文作者在必要的情况下,将不会影响稿件内容表达的图表、光谱、数学推导以及论文的扩展讨论等信息放在SI中,主要基于在同行评审过程中,评审专家可以将其作为评审参考;在作品发表以后,感兴趣的科研人员可以获取所需信息并再现作者的研究成果。化学领域的科研人员欲在ACS期刊上发表论文并共享相关数据,需了解其对SI内容、格式以及获取方面的具体要求。
由于ACS各期刊的学科类别不同,所以期刊收录内容的差异造成其要求科研人员提供的SI内容不同。47种期刊中,17种期刊仅仅提出SI的要求,没有说明哪些数据可以以SI 的形式存储,其余的30种期刊不同程度地对提供在SI中的具体内容作出要求(见表2)。但是需要说明的是,提到SI类型的部分期刊表述比较模糊,比如使用“图”、“表”、“等”这些表达,发文作者难以清晰把握具体哪些数据属于SI的范畴。但是有些期刊的规定就较为明确,比如新化合物光谱图、NMR光谱等。另外,ACS要求科研人员“不可把将要在论文中发表的图表上载到SI文件中。”
![]() |
表 2 ACS期刊SI内容 |
虽然ACS期刊规定了SI中可包含的内容,但大部分并没有说明SI内容的格式。仅ACS Biomaterials Science & Engineering、ACS Combinatorial Science、Biomacromolecules、Journal of Natural Products、Journal of the American Chemical Society、Organic Letters、The Journal of Organic Chemistry 7种期刊提供了NMR光谱(.doc、.docx、.txt、.pdf、.tif)的格式指南。要求提交主要的NMR数据文件(FID文件、获取数据以及处理参数)的ACS Combinatorial Science、Journal of the American Chemical Society、Organic Letters、The Journal of Organic Chemistry的4种期刊同时提供了NMR文件指南。
2.1.2 支撑信息支持的文件格式ACS期刊要求科研人员将SI文件和稿件同时提交并且独立的上载到ACS Paragon Plus Environment。相同格式的所有补充信息的文件应该作为一个文件夹,而不是提交一系列包含单个图像或者结构的文件夹。例如,所有的补充信息可获取的格式为PDF,那么就应该包含在一个PDF文件中。但是如果不能作为单个的文件提交,部分期刊也对此情况作了详细的说明,比如The Journal of Organic Chemistry要求如果作为单个的文件提交不可能,那么所有类型相同的文件应该组合起来。如果提供了不只一个补充信息文件夹,每一个单个的文件应该注明文件名称(例如,NMR_spectra.pdf and Additional_tables.doc)。此外如果稿件含有CIF(Crystallographic Information File)格式的信息,ACS Catalysis、Organic Letters、Organic Process Research & Development等期刊要求必须和其它的文件分开上传。科研人员上传的补充信息文件同时必须满足以下的格式要求:
(1)SI文件的基本信息要求
ACS Applied Materials & Interfaces、ACS Catalysis、ACS Chemical Biology等22种期刊要求SI在前面应该有一页题名页,包含的信息有稿件题名、作者、通讯作者的联系信息等,并且SI的页面应该从S1开始连续标出页码。此外,部分期刊还对SI的页面大小、其中的文本和表格的行距、图表的表头编码格式以及提供的图形的清晰度做出要求。
(2)SI文件的格式
ACS期刊在网上列出了SI支持的文件格式[17],见表3,包括结构绘图软件、文本/电子表格、图形、视频和其他的一些文件类型,需要注明的是zip文件也是一种可接受的文件格式,当有大量的文件时,科研人员可将文件压缩以加快文件的传输速度。
![]() |
表 3 ACS期刊SI支持的文件类型 |
科研人员可以借助ACS期刊在稿件末尾提供的SI简要描述了解材料的属性,并根据需求通过描述信息之后的地址查看、获取SI材料,科研人员还可以通过网站上发表内容旁边的链接快捷的获取。不同期刊对稿件中SI可用性声明的位置要求稍有差异,大部分期刊要求声明跟在论文的结论之后,一些期刊要求置于论文的致谢之后、参考文献之前。47种期刊SI可用性声明具体描述方式稍有差异,总结为表4两种形式,通过提供的链接或DOI号科研人员可以免费获取论文的支撑信息。
![]() |
表 4 SI获取方式 |
ACS中20种有特定数据存储要求的期刊,大部分明确指明“论文发表的条件是作者把材料、数据和协议存储在公开可用的数据仓储中,使得读者可以获取”,通过“must”、“should”、“a condition of publication”等表述来严格要求数据存储。如ACS Infectious Diseases要求包含蛋白质或者核苷酸序列的论文必须向Genbank/EMBL/DDBJ,SWISS-PROT或者本领域合适的数据仓储提交序列号,否则将不予发表。少数期刊的表达则较为开放,比如使用“encouraged”、“Authors areresponsible for”等一些无约束力的词。科研人员根据期刊要求将数据存储到指定的仓储中,使得数据和材料可获取并容易交换,感兴趣的其他科研人员可以获取并重现科研成果,以促进科学发现。总的来说,了解期刊对特定类型数据的发布要求,包括数据类型、存储位置以及数据的获取三个方面,便于科研人员存储以及获取数据。
2.2.1 特定数据的类型有通用数据共享政策的期刊一般会对特定类型的数据作补充说明,事实上,许多期刊仅有特定 数据类型的政策而没有通用的数据共享要求[9]。
20种期刊中只有ACS Central Science有通用数据共享政策,其余的都列出了期刊对具体类型的数据存储规定。由于期刊对数据名称的表达不一,本文对数据作了归并和分类,存储要求中出现频率较高的数据类型,包括序列数据(Sequence Data)、结构数据(Structural Data)、电子显微镜数据(Electron Microscopy Data)、微阵列数据(Microarray Data)、转基因生物和突变体(Genetically Modified Organisms and Mutants),频率分别为10/20(50%),17/20(85%),7/20(35%),7/20(35%),6/20(30%),见表5。除了表中列出的五类数据,Biochemistry在其指南中指出对于包含蛋白质圆二色性谱的论文,鼓励作者在稿件提交之前把原材料、处理过程和元数据存储到PCDDB并且把 PCDDB ID包含在稿件中。此外,Biochemistry和Chemical Research in Toxicology提到将结合常数(binding constants)及其相关信息存储到公共数据仓储BindingDB。
![]() |
表 5 ACS期刊推荐的数据仓储 |
有特定数据要求的20种期刊中,ACS Central Science仅仅阐述了共享数据的通用规定,要求发表论文的作者将材料、数据和条款存储在读者可以获取的公共数据仓储中,没有指出特定的数据类型,更没有指定数据存储的仓储。剩下的19种期刊分别为各种类型的数据指定了数据仓储,见表5,列出了18种期刊为频率较高的五类数据推荐的数据仓储。表5实质上是期刊为每一大类数据指定的仓储的总结,大类数据包含的数据有不同的存储位置,如序列数据包括蛋白质序列数据、核苷酸序列数据、DNA序列数据,期刊对不同数据的存储位置的要求是不同的。Environmental Science & Technology Letters规定DNA 序列数据必须提交到GenBank、ENA或者DDBJ。蛋白质序列数据应该存储在PIR、EBI或者SIB。科研人员按照每种类型的数据指定的仓储将论文数据进行存储,如表6所示为ACS推荐的所有仓储的URL,供科研人员参考使用。对于提交数据的格式ACS没有明确规定,科研人员需根据具体仓储的要求调整数据的格式。科研人员将数据集存储之后,有些期刊规定必须提供已存储的证明材料或者在稿件中列出数据已存储的声明,对于特定类型的数据,期刊要求在稿件中提供数据存储后的序列号、序列码、文件名等。
![]() |
表 6 ACS期刊推荐的仓储的URL |
数据的开放获取涉及多方面的权益问题,有些数据即便按照要求已经存储到指定的仓储中,数据的获取依然会有限制。调研的20种期刊中,数据的可用性要求可分为两类:第一,期刊没有对数据可用性作任何说明;第二,期刊明确要求论文一经发表,所存储的数据必须发布,但数据可用性的限制需根据作者及仓储的要求而定。表7列出了ACS期刊中对数据的可用性作了规定的期刊、数据的内容以及它们在数据要求中的描述。科研人员在获取这些数据时需注意其可用性。
![]() |
表 7 ACS期刊数据的可用性 |
总结分析ACS期刊科研数据发表政策可得出如下结论:第一,ACS的49种期刊中有47种对数据存储提出要求,1种期刊为数据期刊,1种期刊未提及数据存储的要求;第二,有数据政策的期刊要求作者将论文数据以SI的形式提供,几种特定类型的数据提交到指定的数据仓储中;第三,ACS期刊要求存储 的科研数据不只涉及化学领域,还涉及化 学交叉学科的数据,主要为生物学领域的几种特定类型的数据。
对ACS期刊数据政策的研究有助于准备在ACS期刊上投稿的化学领域科研人员了解期刊数据政策的共性要求和特性要求,提醒科研人员不仅要熟悉化学学科数据的要求,而且要了解化学交叉学科的数据的要求,以在论文发表过程中更好的管理和共享论文数据。从侧面也提升了科研人员共享数据的意识,响应期刊的数据共享政策。此外,国内期刊出版界应借鉴国外实践经验,重视学术论文和科研数据的集成出版,制定完善和严格的数据发表政策,倡导科研人员公开发表论文相关数据。
[1] | OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2015-01-16].http: //www.oecd.org/sti/sci-tech/38500813.pdf.(![]() |
[2] | Savage C J,Vickers A J.Empirical study of data sharing by authors publishing in PLoS journals[J].PloS One, 2009, 4(9): e7078.(![]() |
[3] | PLoS ONE Editorial and Publishing Policies[EB/OL].[2015-01-16].http://www.plosone.org/static/editoriall sharing.(![]() |
[4] | Nature Journal.Authors& Referees, Editorial Policies, Availability of data &materials[EB/OL]. [2015-01-16]. http://www.nature.com/authors/policies/availability.html close.(![]() |
[5] | Science Magazine.General Information for Authors. Submission requirements and conditions of acceptance[EB/OL]. [2015-01-16].http://www.sciencemag.org/site/feature/contribinfo/prep/gen_info.xhtml dataavail.(![]() |
[6] | Welcome, Scientific Data[EB/OL].[2015-01-16]. http://www.nature.com/news/welcome-scientific-data-1.15293.(![]() |
[7] | CEOS Data Life Cycle Models and Concepts[M].CEOS.WGISS.DSIG.TN01, 2011.11.(![]() |
[8] | Alsheikh-Ali A A, Qureshi W, Al-Mallah M H, et al. Public availability of published research data in high-impact journals[J]. PloS One, 2011, 6(9): e24357.(![]() |
[9] | Piwowar H A, Chapman W W. A review of journal policies for sharing research data[C]//ELPUB2008. 2008.(![]() |
[10] | Hrynaszkiewicz I, Norton M L, Vickers A J, et al. Preparing raw clinical data for publication: guidance for journal editors, authors, and peer reviewers[J]. BMJ (CR)-print, 2010, 340(8): c181.(![]() |
[11] | 傅天珍,陈妙贞.我国学术期刊数据出版政策分析及建议[J].中国出版,2014(23):31-34.(![]() |
[12] | 吴蓉,顾立平,刘晶晶.国外学术期刊数据政策的调研与分析[J].图书情报工作,2015,59(7):99-105.(![]() |
[13] | 刘晶晶,顾立平.数据期刊的政策调研与分析——以Scientific Data为例[J].中国科技期刊研究,2015,26(4):331-339.(![]() |
[14] | 欧阳峥峥,青秀玲,顾立平,等.国际数据期刊出版的案例分析及其特征[J].中国科技期刊研究,2015,26(5):437-444.(![]() |
[15] | 雷秋雨,马建玲.数据期刊的出版模式与发展研究[J].图书与情报,2015(1):112-116.(![]() |
[16] | ACS Publications A-Z[EB/OL].[2015-01-16].http://pubs.acs.org/action/showPublications?display=journals.(![]() |
[17] | Acceptable Software by File Designation[EB/OL].[2015-01-16].http://pubs.acs.org/page/4authors/submission/software.html.(![]() |