2. 华中师范大学, 湖北 武汉 430079;
3. 中国科学院, 北京 100864
2. Central China Normal University, Wuhan 430079, China;
3. Chinese Academy of Sciences, Beijing 100864, China
天文学是一门古老而又始终随着时代进步不断发展的学科。现代天文学已经进入多波段和时域天文学时代,成为一门数据密集型和数据驱动的科学[1]。天文观测数据资源的集成和数据资源开放共享,对天文学研究和教育普及至关重要。
天文学是一门非常开放的科学,在数据和资源的开放共享方面一直发挥着引领作用。IVOA①(①http://www.ivoa.net/)、VizieR②(②http://vizier.u-strasbg.fr/ viz-bin/ VizieR)、NED③(③http://ned.ipac.caltech.edu/)、ASCL④(④http://asterisk.apod.com/ wp/)、ADS⑤(⑤http://www.adsabs.harvard.edu/)、arXiv.astro-ph⑥(⑥http://arxiv.org/ archive/ astro-ph)都是天文学领域资源共享的成功范例。这些成功的范例逐渐培养起了天文学家的行业传统。在这样良好传统的基础上,如果能通过政策和制度的手段进一步规范和要求,必将有利于天文数据开放共享事业的长远发展。建立健全符合客观规律的天文观测数据资源开放政策与制度,打造天文观测数据资源共享平台,通过公正、合理的手段集成天文观测数据资源,会使这些数据资源得到规范的管理,充分发挥它们的科学价值,促进天文学自身的发展和社会进步。
本文着眼于天文学的长期发展,旨在为制定国内天文观测数据资源共享政策提供参考,规范数据汇交、管理和开放共享流程,对国内外科学数据和科技计划,特别是天文观测数据资源开放共享政策等方面的情况进行了调研、分析和研究。本文第1节简要介绍科学数据资源开放共享政策;第2节重点介绍天文观测数据开放共享政策;最后,针对国内天文观测数据资源共享现状,对天文观测数据资源共享工作发展和政策制定提出了建议。
1 科学数据开放共享政策推动科学数据开放共享的动力主要来自于政府机构、基金会、学术团体、出版商以及用户的要求。科学数据共享能营造更丰富的数据环境,使研究人员能够轻松地发布、发现、访问和使用数据[2]。相关制度和法规的制定和实施极大地促进了科学数据的开放使用。本节主要介绍国内外政府与机构有关科学数据共享的规定和政策。
1.1 国际组织国际科学数据委员会(CODATA) http://www.codata.org/index.html和经济合作与发展组织(OECD) http://www.oecd.org/以及世界数据系统(WDS) http://www.icsu-wds.org/、研究数据联盟(RDA) http://www.rd-alliance.org/等国际组织在保护科学数据和推动科学数据更广泛的应用和共享方面做出了很大贡献。这些国际组织要求其成员实行对公共领域科学研究数据“完全与公开”的数据政策,向国际社会提供无歧视的、完全的数据服务,对数据和产品实现自由和无限制的国际交换,保证完全、公开、及时的信息交换。数据应该以尽可能低的价格提供给用户。数据定价的原则是不能高于数据复制和分发所需的成本。
1.2 欧洲欧洲国家在科学数据共享方面经历了从最初采取收回成本的数据共享政策到“完全与公开”的数据共享政策的过程。研究与实践表明,收回成本的数据共享模式并不能使科学数据的价值最大化,并且也难以达到减轻资金压力的目的。因此,欧洲议会和欧盟委员会最终规定除非有正当理由,公共部门不得向数据再利用者收取数据生产成本费 http://ec.europa.eu/index_en.htm。英国医学院研究理事会资助的个人或机构必须遵守数据创建、收集和管理的相应责任,在项目申报书中必须编制数据保管费用计划,在年底资助款项汇报中介绍数据管理与共享相关的工作[3]。
1.3 美国美国科学数据共享政策均以 《信息自由法》 和 《版权法》 为法律基础。这两大基本法律明确了公众对科学数据具有自由获取的权利。除了国家层面的法律法规,美国还有研究机构、学术社团、基金会、行业管理部门制定的具体行业数据共享政策和管理办法[4]。如美国国立卫生研究院((National Institutes of Health,NIH) http://www.nih.gov/、美国国家科学基金会(National Science Foundation,United States) http://www.nsf.gov/index.jsp和美国国家科学理事会(National Science Board,NSB) http://www.nsf.gov/nsb/均根据 《信息自由法》 制定了相关的数据共享政策,充分体现出科学数据 “完全与公开” 的共享原则。
1.4 中国我国政府也已经认识到科学数据共享的重要性,《中华人民共和国科学技术进步法》 第四十六条规定,“利用财政性资金设立的科学技术研究开发机构,应当建立有利于科学技术资源共享的机制,促进科学技术资源的有效利用。”
国家科学技术部在推动科学数据开放共享方面做出了良好的表率。 《国家科技计划项目管理暂行办法(科学技术部令第5号)》 http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577294215924规定在项目实施管理时 “各类国家科技计划必须建立相互兼容的数据库,实现信息、数据资源共享”,项目验收时项目的承担者需要提交有关验收资料及数据。 《国家重点基础研究发展计划(973计划)管理办法(国科发计〔2011〕626号)》 http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577272814774规定项目承担单位和课题承担单位按照科技部有关科学数据共享和科技计划项目信息管理的规定和要求,按时上报项目和课题有关数据。同时指出“推动科学数据共享”是项目首席科学家的主要职责之一。《国家科技支撑计划管理办法(国科发计2011]430号)》 http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577273283118在 “知识产权、技术标准与成果” 中规定 “建立规范、健全的项目科学数据和科技报告档案,建立项目科技资源的汇交和共享机制。项目组织单位和课题承担单位按照国家有关科学数据共享的规定,按时上报项目(课题)有关数据和成果。建立健全支撑计划项目数据和成果库,实现信息公开、资源共享。”《国家高技术研究发展计划(863计划)管理办法(国科发计[2006]329号)》 http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577292654471规定 “项目(课题)承担单位应按照科技部有关科学数据共享和科技计划项目信息管理的规定和要求,按时上报项目(课题)有关科研资料和数据。” 科技基础性工作专项在试行的 《科技基础性工作专项项目科学数据汇交管理办法(试行)》 http://program.most.gov.cn/htmledit/0984A2B1-6B3B-70EB-1CC0-AE4D6D2C9418.html中规定 “科技基础性工作专项项目必须在项目验收前按照项目任务书的考核指标和有关要求保质保量地完成数据汇交。科学技术部基础研究司指定相关科学数据管理机构具体负责科学数据汇交、保管、共享与服务工作。” 该办法还对组织管理、汇交方案和汇交内容、汇交流程、数据管理与共享服务、监督与处罚等各有关环节做出了详细的规定。
国家自然科学基金委员会2014年5月出台了 “受资助项目科研论文的开放获取政策” http://www.nsfc.gov.cn/publish/portal0/tab87/info44471.htm,要求“将同行评议后录用的最终审定稿,存储到国家自然科学基金委员会的知识库,不晚于发表后12个月开放获取。” 《国家重点实验室建设与运行管理办法》 http://www.nsfc.gov.cn/publish/portal0/tab220/info24194.htm中要求重点实验室要按照有关规定和要求实施数据共享。《国家自然科学基金条例(国务院令 第487号)》 http://www.nsfc.gov.cn/publish/portal0/tab220/info24216.htm等条例和规定中提及项目研究形成的论文、专著、软件、数据库、专利等均须标明 “国家自然科学基金资助项目” 并及时向科学基金委员会申报登记,但略有遗憾的是未对科研数据的开放共享做出明确要求。
为促进科学数据资源的开放共享及有效利用,科技部、中国科学院等部门通过工程项目的方式投资建设了一批以科学数据共享为主要内容的数据库群和服务平台,制定了一系列科学数据共享的技术规范和管理办法。如基础科学数据共享网 http://www.nsdc.cn/index.html研究制定了 《基础科学数据共享管理策略规范》、《基础科学数据的元数据规范系列》 等标准规范。国家科技基础条件平台下的科学数据共享平台——地球系统科学数据共享平台 http://www.geodata.cn/Portal/index.jsp,以整合、集成科研院所、高等院校和科学家个人科研活动所产生的分散科学数据为工作重点,研究制定了《地球系统科学数据共享平台章程》。此外,还有《地震科学数据共享管理办法》 http://data.earthquake.cn/policy/gxbf.htm、《气象资料共享管理办法》 http://www.escience.gov.cn/article/article_2897.html、《先进制造与自动化科学数据中心免责说明》 http://www.amadata.net.cn/mzsm.aspx和 《遥感数据中心数据共享协议》 http://rsdc.bnu.edu.cn:8080/rsdac/modules/apply/等更多领域的数据共享管理办法或规定出台。
2 天文观测数据开放共享政策经调研发现,国外天文观测数据有较完善的共享使用政策,大多参照国家制定的 “完全与公开” 数据共享原则,并根据天文学研究的具体情况制定自己的数据资源开放共享规定和规范。这些规定和规范不仅涵盖了数据存储、发布、管理、访问、分析和传播等各个层面,而且还对数据共享活动中所涉及的个人隐私、数据安全、著作权等问题做出了明确的规定。
国内天文观测设施和观测项目越来越多,郭守敬望远镜(LAMOST)和中国科学院紫金山天文台的13.7 m毫米波射电望远镜已公开提供了明确而规范的数据政策。更多天文观测设施和观测项目也在酝酿制定各自的数据使用政策。
2.1 国外天文观测数据开放共享政策天文观测数据自获取之后,其生命周期一般分为两个阶段,即数据保护期和公开使用期。鉴于此,天文望远镜项目制定的数据使用政策一般包括保护期内的使用政策和公开使用后的政策两部分。
针对保护期内的数据制定的使用政策重点放在出版政策上。出版政策是与某望远镜或数据相关的学术论文等科学产出需要遵循的行为规范和指南,例如斯隆数字巡天项目(SDSS)制定的出版政策(The SDSS-III Publication Policy) http://www.sdss3.org/collaboration/publication.php。出版政策的主要内容一般包括数据资源说明、数据保护期界定、数据归档管理规范、论文署名原则、成果出版程序、致谢及数据引用要求等。
2.1.1 数据资源说明观测项目获得的数据资源可能有很多种类,用户根据研究课题的不同需要的数据也不相同,所以出版政策中需要明确说明该政策所针对的数据资源。为方便用户识别和使用观测数据,出版政策中需对数据的格式进行说明。
2.1.2 数据保护期界定为保证在望远镜设计、建造和观测运行过程中投入大量时间和精力的人员能优先获取数据以及在相应文章中署名的权益,最大可能地提高数据的利用率和影响力,天文观测数据在公开发布之前一般都有一段数据保护期。保护期内,观测数据由观测者和项目合作者等特定范围人员优先使用。保护期过后,其他人员就可以提交申请获取数据的使用权。
数据保护期的期限一般由望远镜管理机构或者观测项目制定。调研发现,保护期时限主要根据以下3种情况确定。
第一,根据观测项目获取数据的难易程度划分数据保护期。如欧洲南方天文台(ESO)在甚大望远镜/甚大望远镜干涉仪科学运行政策(VLT/VLTI Science Operations Policy) http://www.eso.org/sci/observing/policies/Cou996-rev.pdf中和澳大利亚平方千米阵列先导项目(ASKAP)在用户政策(ASKAP User Policy) http://www.atnf.csiro.au/projects/askap/policy.html中均根据研究课题的科学价值和技术操作的可行性分配望远镜的观测时间,并根据使用望远镜时间长短不同分为3类观测项目,不同项目数据的保护期不同。比如,巡天科学项目和临时目标项目(ToO)的数据没有保护期,经过质量验证之后直接公开。客座科学项目的数据保护期一般是一年。
第二,根据数据质量验证和数据分析利用所需要的时间规定数据保护期。大部分望远镜观测项目设定了默认数据保护期,从观测获取数据当日开始计算分别为三个月、半年、一年、一年半甚至两年等。有些观测项目的数据可能需要分多个阶段提交,这时数据保护期从各个数据集提交日起满默认期限为止。
第三,根据各个天文台自己的政策规定数据保护期。如美国国立光学天文台的数据使用政策(NOAO Data Use Policy) http://archive.noao.edu/doc/NOAO_DHB/NOAO_Data_Handbookv1.1.pdf中说明科学数据的保护期取决于天文台的相关政策,并规定数据的默认保护期为18个月,从观测之日起计算。
但并不是所有的数据都遵循默认保护期,可以根据不同的情况进行调整。美国国立太阳天文台(NSO)的数据政策(NSO Data Policy) http://www.nso.edu/data_policy中注明,一般情况下保护期为18个月,但特殊情况时项目负责人(PI)可以向相关部门提出申请调整期限。欧洲南方天文台在观测提案指南(ESO Call for Proposals) http://www.eso.org/sci/observing/phase1/p94/CfP94.pdf中指出如果项目负责人希望缩短保护期可在提案文档中注明。同时,指南还明确规定公共巡天、定标和技术数据不受保护期限制,归档后随即公开使用。钱德拉数据中心(CXC)在 “钱德拉数据库中的公共数据说明”(Information about Public Data in the Chandra Data Archive) http://cxc.harvard.edu/cda/public.html中提及,并不是所有的数据都有保护期,仅仅是真正需要保护期的数据才有。
2.1.3 数据归档管理为保证数据资源的科学价值,观测数据在提交归档之前,项目负责人必须对数据质量进行验证。望远镜项目组一般都鼓励用户充分利用已有的观测数据,并向项目负责人反馈数据资源的使用情况,进而构成一个良性循环。为对数据资源进行有效管理,用户使用保护期数据必须遵循一定的程序,一般情况下通过登记注册的方式访问数据库。一方面为方便管理员统计数据的访问量,另一方面方便有针对性地管理保护期数据。
2.1.4 学术论文署名及出版现代科学研究,学术合作是非常普遍的现象,天文学也不例外。基于望远镜观测数据发表的学术论文通常是多方合作的成果,这就自然产生了论文署名和知识产权等一系列问题。为确保望远镜和观测项目产出的论文公平代表了各类参与者的贡献,望远镜管理机构和项目组需及时有效地审查论文的署名、致谢等内容是否符合出版政策的要求。公示结束并无异议后才可以投稿。
SDSS在出版政策中明确规定了基于观测数据发表科研论文的版权归属原则。指出利用SDSS项目观测数据发表的科研论文,除了分析处理数据并撰写论文的研究人员之外,其他执行天文观测的工作人员和参与建设望远镜的技术人员等均可要求署名。除望远镜的建设者之外,其他要求署名的人员需要提交一份简短的报告,阐明其对该项目的贡献。
2.1.5 致谢及数据引用数据开放共享并不等于完全自由使用。用户在下载或获取数据之后有及时反馈使用情况的义务,并且在科研成果中应该对所利用的数据进行引用并致谢相关望远镜项目组和贡献者。这一方面是良好学术道德的体现,另一方面也会营造良好的资源开放共享氛围,有利于学科长远的发展。
为方便用户使用同时满足自己的需求,多数望远镜管理者和天文数据中心制定了致谢标准,给出了标准的数据使用致谢内容。致谢的内容大多包括项目描述和参与项目单位清单。同一个望远镜项目可能有不同的致谢方式。根据不同的数据资源或者数据资源用途不同而采用不同的致谢标准。天文数据中心的致谢内容中,一般情况下要求不仅致谢提供数据和服务的数据中心,同时还要致谢所用数据对应的项目。
为有效地再利用数据资源,方便更多用户查询与阅读相关资料,同时也更好地承认数据生产者和保管者所做的贡献,2014年4月美国国家科学基金会号召科学界制定针对软件和数据引用的规范和标准 http://www.nsf.gov/pubs/2014/nsf14059/nsf14059.pdf。与很多学科相比,天文学在这方面已经走在前面。如欧洲南方天文台在观测提案指南中要求基于ESO望远镜观测得到的科学成果需在论文脚注中注明相应的观测提案号。美国宇航局红外处理与分析中心的河外数据库(NED)在致谢标准(Acknowledging NED) http://ned.ipac.caltech.edu/中明确指出在论文中对所引用的数据不仅要进行致谢还要添加脚注,并给出标准脚注模板。
2.1.6 公开数据的使用政策对于公开使用的数据资源,包括图像资料和视频,一般都没有严格的版权要求。通常都允许并鼓励公众把这些资源用于非商业目的的教育和公益事业,鼓励社会各界积极参与天文学数据共享工作,不需要特别授权。同时,开放数据的使用应当遵守国家有关法律法规,任何单位和个人不得利用天文观测数据及共享平台从事危害国家安全、社会公共利益和他人合法权益的活动。
为保护数据提供者的利益,有些项目要求在图像资料上标明其出处,如钱德拉X射线望远镜数据中心(Chandra X-Ray Center,CXC)在图片、产品、技术使用约定(Conditions of Use of Images,Products or Technologies (materials)) http://chandra.harvard.edu/photo/image_use.html中要求对被使用的图片添加 “NASA/CXC/SAO” 的标注。
NASA在数据和信息政策(Data & Information Policy) http://science.nasa.gov/earth-science/earth-science-data/data-information-policy/中明确说明公开使用的天文观测数据资源未经许可只能用于非商业目的,商业目的的用途需要经过许可。任何用户不能以任何方式向第三方出售、转让、赠送或复制所共享的数据。用户使用数据资源应该具有相应的专业知识,能够充分认识和理解数据所存在的问题,并能承担使用数据所带来的各种后果。望远镜项目和数据中心不会对用户使用数据产生的问题负任何责任。
2.2 国内天文观测数据资源的开放共享 2.2.1 国内主要观测数据资源随着我国天文学研究的不断发展,特别是天文观测设施和观测项目的推进,国内自产的观测数据越来越丰富。中国科学院系统的5个天文台,即国家天文台、紫金山天文台、上海天文台、云南天文台、新疆天文台,是国内天文观测设备的主要运行管理机构,同时也是天文观测数据的主要来源。
中国天文数据中心 http://casdc.china-vo.org/提供观测数据的归档、存储、备份、使用以及数据产品的发布共享等服务。目前,中国天文数据中心公开释放的数据包括郭守敬望远镜巡天数据、中国之星小望远镜阵(Chinese Small Telescope Array,CSTAR)天体测光数据、云南天文台2.4 m光学望远镜数据、BATC多色巡天数据等。表 1列出了截止2014年5月中国天文数据中心提供服务的国内观测数据资源。
数据集 | 数据量 (2014年5月) | |
LAMOST望远镜数据 | 14TB | |
南银冠U波段巡天数据 | 6TB | |
BOOTS-4望远镜数据 | 4.5TB | |
丽江望远镜数据 | 3.8TB | |
怀柔太阳射电数据 | 3.2TB | |
南极CSTAR小望远镜阵数据 | 2.6TB | |
BATC多色巡天数据 | 2.3TB | |
南极AST3望远镜数据 | 1.6TB | |
SONG 50Bin望远镜数据 | 0.6TB | |
怀柔太阳磁场数据 | 0.2TB |
自2008年出光以来,LAMOST已经经历了测试观测、先导巡天、正式巡天等阶段。根据LAMOST的数据使用政策,保护期内的数据,国内天文界人士和国外合作者可以与郭守敬望远镜运行和发展中心联系获取,国外其他天文学家可通过与郭守敬望远镜合作的方式获取。如有用户需要使用其他的数据集,可以通过邮件与中国天文数据中心的管理员联系申请 http://casdc.china-vo.org/data/lamost/pilot。
紫金山天文台毫米波射电天文数据库 http://www.radioast.csdb.cn/收录了紫金山天文台青海观测站13.7 m毫米射电望远镜观测的分子谱线数据。按照其数据政策超过保护期的数据除跨年度的长期项目外已全部开放,所有人都能下载使用。
中国科学院科学数据云 http://www.csdb.cn/中的空间科学数据网格 http://www.space.csdb.cn/?About,以中科院自主获取的空间科学数据为重点依托,以国外空间科学数据为重要补充,按日地空间物理和行星科学两个主要的学科方向进行分布式数据资源的整合,内容涵盖行星际、中高层大气、宇宙线、电离层、太阳活动、近地空间等典型天、地基空间环境要素观测数据。
此外,国内较系统的观测数据还有紫金山天文台行星科学数据、空间碎片数据,上海天文台VLBI射电天文和深空测量数据,新疆天文台南山25 m射电望远镜脉冲星数据,云南天文台抚仙湖太阳观测数据,盱眙近地天体望远镜银河系反银心方向数字巡天数据,21CMA宇宙第一缕曙光巡天数据等。
2.2.2 开放共享政策目前,国内天文学领域还没有统一的数据开放共享政策。LAMOST和紫金山天文台13.7 m毫米波射电望远镜制订了明确的数据政策并公示执行。更多情况是依据所谓的国际惯例操作,缺乏规范的数据政策和管理规程。
LAMOST制定了详细规范的 《郭守敬望远镜(LAMOST)光谱巡天出版政策》 http://www.lamost.org/public/science/policy/publication和 《光谱巡天数据政策》 http://www.lamost.org/public/science/policy/data。数据政策详细介绍了LAMOST望远镜的基本参数、数据产品类型、数据发布和使用政策。LAMOST巡天的最终数据将向公众开放,即为公开数据。原始数据不对社会公开,由望远镜运行部门长期保存。公开数据可由公众自由使用,但要求致谢,并制定了具体的致谢标准。若有违反将限制再次使用数据。同时申明数据公开使用,用户有及时(3个月内)反馈使用情况的义务。为保证项目和参与单位及参与人员的权利,数据在公开前,仅供参与人员按照“郭守敬望远镜科学委员会”确认的研究课题使用。违反政策者将可能被科学委员会取消数据使用权。出版政策中规定了可以使用保护期数据的参与单位和参与人员范围,并规定使用数据的相关权利和义务。出版政策是郭守敬望远镜的科学类及技术类产出物的出版指南,规定了利用望远镜相关数据所得到的科学类文章、技术类文章及数据发布类出版物所必须遵守的权利和义务。
紫金山天文台13.7 m毫米波射电望远镜接受国内外专家的观测课题申请。对一般性课题观测,数据将由课题申请者独占使用一年后成为开放共享数据;跨年度的长期项目在观测结束日起满一年后成为开放共享数据。开放前的数据只有课题申请人在网站登录后才能下载。开放后的数据所有研究团体和个人都能检索并下载使用。数据用户被要求在取得科研成果之后注明使用了13.7 m望远镜或毫米波射电天文数据库 http://www.radioast.csdb.cn/shujuzhengce.php。为了更好地体现紫金山天文台毫米波实验室人员对13.7 m毫米波射电望远镜的贡献,在科研成果中对观测数据的引用做了一定要求。对多谱线系统数据、超导成像频谱仪数据都有不同的引用要求 http://www.radioast.csdb.cn/ywsm.php。
国内有些望远镜通过网站或者相关文献给出了简略的数据使用政策。比如,国家天文台兴隆观测基地2.16 m光学望远镜规定数据保护期为18个月。上海天文台1.56 m光学天文望远镜规定观测数据由项目负责人负责,保护期为1年。一些小口径的望远镜,从事长周期观测课题,观测期长达数年甚至超过10年。这种情况下,所得到的观测数据一般不轻易公开。
2.2.3 开放共享现状分析国内天文数据的开放共享工作仍处于起步和早期发展阶段,这与国内天文学研究的发展状况是一致的。随着观测设施的不断建设,观测项目不断增多,自产的数据资源也会越来越丰富,并将很快进入海量数据时代。观测数据的开放共享对学科发展越来越重要并日益成为用户、资助者、管理者多方关注的焦点。
在参考国际同行做法并充分考虑国内实际情况的基础上,LAMOST率先制定了比较完善的数据政策,从观测数据的获取、管理、发布、使用到论文发表等各个层面都有明确的规定。但是,国内天文观测数据资源的开放共享工作还存在不少的问题,主要体现在如下几方面。
第一,缺乏明确的国家层面的法律体系。因为缺乏完善的国家层面的法律法规,已制定的相关政策只是天文学界的管理者和用户参照国际同行做法达成的共识,并不具备法律效力,给贯彻执行带来困难。
第二,科研项目资助体系中的制度约束和政策支持需进一步加强。虽然科学技术部对973计划、863计划、科技支撑计划、科技基础性工作专项等提出了数据归档和共享的要求,国家自然科学基金委员会也对资助项目提出了开放论文的要求,但尚有很大需要加强和完善的空间。特别是作为天文学研究经费主要来源的国家自然科学基金委和中国科学院应明确规定项目承担单位和负责人有开放共享科研数据的义务,并制定具体的项目管理办法来落实。
第三,缺乏行之有效的管理体制。目前成功的数据管理和开放共享案例大多是项目组和首席科学家自发努力的结果。没有一个政府、管理机构、科研院所乃至社团组织等组织层面上的管理体制,没有一个完整的天文观测数据生命周期管理环境,限制了数据资源的有效共享。科技部基础司对科技基础性工作专项项目验收的规范和流程在数据归档、共享方面做出了有益的尝试,值得天文领域关注和借鉴。
第四,缺乏完善的数据归档、汇交和开放共享平台。海量的天文观测数据在国内天文界已经备受关注,但因为缺乏一个领域内普遍认可的开放共享平台,同时大部分望远镜管理者也没有建立规范的数据发布渠道,阻碍了观测数据开放共享的进程。一方面,科研人员投入很多时间和精力进行长期观测所获数据不能迅速及时地共享,导致科研人员的贡献和付出不能及时获得认可。另一方面,观测数据分散在不同机构、团组甚至个人手中,只有在特定情况下通过特定的方式被有限的科研人员使用,科学价值无法充分发挥。
第五,缺乏数据资源开放共享领域的专业人才。海量数据的归档管理和分析挖掘离不开掌握专业知识和技能的人才。数据资源和服务的作用没能得到充分发挥,其原因主要是缺乏从事数据开放共享和分析处理的专业人才。科研领域中重硬轻软、重科学轻技术的思想仍然普遍存在。
第六,数据生产和管理者面临着其他的一些困难,导致不愿意或者不能够将数据开放共享。比如,因为天气、仪器、人员等因素使得观测数据质量差,没有脸面开放共享;因为缺乏必要的人力等资源无法将观测数据加工为数据产品,无法开放使用;因为担心同行竞争,对自身的领域优势造成威胁,不愿意毫无保留地共享等。
3 建议与展望习近平同志在中国科学院第十七次院士大会、中国工程院第十二次院士大会上的讲话中要求 “着力完善科技创新基础制度,加快建立健全国家科技报告制度、创新调查制度、国家科技管理信息系统,大幅提高科技资源开放共享水平”。在天文学研究已经进入数据密集型和数据驱动的时代,观测数据的开放共享成为天文学发展的基本要求。本文提出以下几条具体建议,希望能够为我国有关政府部门和科研机构在制定科技发展战略和行动计划时提供参考。
第一,推动科学数据开放共享政策的制定。和其他学科、行业、部门与机构合作共同推进国家科技资源开放共享有关法律法规的制定。由中国科学院所属天文台牵头,联合高校、科普场馆等相关机构制定天文科技资源开放共享办法。通过法律法规和管理制度为科学数据的开放共享保驾护航。
第二,建立有效的数据开放共享管理体制。在国家、省、市基金管理部门,中国科学院,天文台站,高校及其有关学院,建立有效的管理体制,将科学数据开放共享的法律法规等政策落到实处。改进科研项目资助管理模式、科研成果评审评价机制、科研人员绩效考核机制,在科研活动的各个环节兑现科学数据开放共享的承诺。
第三,打造国家或部门级天文数据基础设施。借助先进的信息技术手段,实现物理上数据分布式存储,逻辑上资源统一汇交、管理和使用。规范数据的归档和质量控制,支持国际虚拟天文台联盟数据互操作相关标准,支持元数据的汇交和数据的统一检索访问。通过建设这样的数据基础设施,减轻望远镜管理者和观测项目数据归档、管理和发布工作的负担,方便用户对资源的发现和使用。
第四,发展数据采集、归档、管理、分析、共享所需要的核心技术。为了适应新的挑战,增强从海量数据中获取信息和知识的能力,需要发展数据全生命周期中各环节的核心技术,比如绿色数据存储技术、高速数据传输技术、复杂数据融合和互操作技术、海量数据处理技术、数据挖掘和可视化技术、数据长期保存与使用技术等。
第五,积极培养新的专业人才和研究队伍。为了充分利用现有和未来产生的海量数据和数据技术,必须培养新的专业人才,培养具有数据式思维和计算式思维的下一代科学家。要建立专门从事数据开放共享工作的部门和研究队伍,并与学科研究人员深入合作,互助多赢,通过专业的人才完成专业的工作。
第六,加大科学数据资源的宣传教育和应用推广。通过宣传教育增强科研人员科学数据开放共享的意识。综合利用传统和新媒体手段向专业、业余、公众用户宣传优质的天文观测数据资源和使用时所需的相关知识与技术方法,挖掘潜在的用户和应用,充分发挥数据的科学价值。
经过几代人数十年的不懈努力,我国天文学研究目前正从重点跨越阶段进入整体跨越阶段,以观测数据为代表的天文科技资源开放共享日益成为支撑天文学长远发展的内在动力。中国虚拟天文台在中国科学院 “十二五” 科研信息化专项和国家发改委高技术服务业研发及产业化专项的资助下,正以国内核心天文观测设备的时间申请、审批,数据汇交、共享、使用,课题设计、开展为线索,融合天文观测和科研活动所需的科学数据、科技文献、高性能计算、软件和实用工具等资源,建设一个物理上分散、逻辑上统一的网络化科学研究平台。有望在中国科学院和各天文台站的共同努力下,制定出切实可行的观测数据等科技资源开放共享政策,并借助这个平台的建设显著推动国内天文数据资源的集成融合和开放共享。
致谢:感谢中国虚拟天文台理事会、学术委员会及研发团队为本文完成提供的大力支持!感谢中国天文数据中心(国家科技基础条件平台——地球系统科学数据共享平台——天文科学数据共享平台)的数据资源支持。
[1] | 崔辰州, 薛艳杰, 李建, 等. 中国科研信息化蓝皮书[M]. 北京: 科学出版社, 2013: 251. |
[2] | 黄永文, 张建勇, 黄金霞, 等. 国外开放科学数据研究综述[J]. 现代图书情报技术, 2013(5): 21-27. Huang Yongwen, Zhang Jianyong, Huang Jinxia, et al. Research on the open research data[J]. New Technology of Library and Information Service, 2013(5): 21-27. |
[3] | 刘细文, 熊瑞. 国外科学数据开放获取政策特点分析[J]. 情报理论与实践, 2009, 32(9): 5-9+18. Liu Xiwen, Xiong Rui. Analysis of the characteristics of policies on open access to scientific data in foreign countries[J]. Information Studies:Theory & Application, 2009, 32(9): 5-9+18. |
[4] | 李娟, 刘德洪, 江洪. 国际科学数据共享原则和政策研究[J]. 图书情报工作, 2008, 52(12): 77-80. Li Juan, Liu Dehong, Jiang Hong. Research on international data sharing principles and policies[J]. Library and Information Service, 2008, 52(12): 77-80. |