扩展功能
文章信息
- 岳玉娟, 吴海霞, 任东升, 王君, 刘起勇
- YUE Yu-juan, WU Hai-xia, REN Dong-sheng, WANG Jun, LIU Qi-yong
- 国家重要监测数据整合平台的建设
- Construction of a national important surveillance data integration latform
- 中国媒介生物学及控制杂志, 2019, 30(4): 387-390
- Chin J Vector Biol & Control, 2019, 30(4): 387-390
- 10.11853/j.issn.1003.8280.2019.04.007
-
文章历史
- 收稿日期: 2019-02-26
- 网络出版时间: 2019-6-20 19:57
互联网技术的飞速发展使企业和科研工作迈向了数据化,但同时也带来了数据分散、数据孤立、数据整合困难等问题[1]。国内数据整合研究侧重于基础和技术研究,应用上侧重商务智能、面向服务应用等商务方面[1],从万方数据库以“数据整合”为关键字搜索到的文献大多是关于房地产、地籍、海洋沉积物等方面的信息整合[2-5]。而国外数据整合研究更多关注地理信息系统(GIS)、遥感(RS)、生物信息学、基因表达等公共事业方面[5-14]。此外,以往相关领域信息整合平台构建,为本次国家重要监测数据整合平台的实现提供了参考[15-16]。
由于现有的国家重要监测的数据量庞大且复杂、时空跨度大、数据标准不一、数据格式多样、管理分散、质量参差不齐等,造成了“数据孤岛”和“信息孤岛”,不利于数据交换和共享[17]。随着国家重要监测数据信息化的发展和应用,基于统一标准和格式的国家重要监测数据库,建立国家重要监测数据查询与可视化平台,数据整合技术是基础和关键。本课题组从全局角度出发,厘清数据的准确性、一致性、完整性、可用性,重点解决数据整合平台构建过程中的数据过剩、数据冗余问题。
1 材料与方法 1.1 材料本研究依托国家重点研发计划,其中国家重要监测数据包括重要病媒生物、重要病媒传染病、重要检疫性入侵生物、病原微生物名录和生物安全组学数据,也包括气象和空间地理环境数据,数据时间跨度为2005年至今,空间跨度为全国(图 1)。
1.2 方法参照黄华南[2]提出的以数据为核心,基于数据自身特点的数据整合方案。根据时间属性、空间属性和生物学属性,对国家重要监测数据开展数据整合。其中,重要病媒生物、重要病媒传染病、重要检疫性入侵生物和气象数据时间属性为“年/月”,空间属性为“省/市/区(县)”,从而该类数据之间可通过时间和空间属性开展数据整合。病原微生物名录中“宿主”字段,存储了诸如“蚊、蝇、鼠”等宿主。生物安全组学数据中“名称”字段,存储了诸如“蚊、蝇、鼠”等名称,因此,病原微生物名录和生物安全组学数据可通过生物学属性与病媒、病媒传染病和检疫性入侵生物等开展数据整合。
本平台采用基于J2EE(Java2平台企业版)体系的B/S(浏览器/服务器)架构进行设计,采用JAVA编程技术,按3层的设计思路进行扩展,在用户终端和最终数据端之间建立接入中间层,方便系统的部署和维护,增强系统的可扩展性和灵活性。提供数据集成、应用集成、流程集成、界面集成等技术手段,实现各功能的总集成。
以数据整合为核心,搭建国家重要监测数据整合平台(图 2),平台功能包括:①平台介绍,整体介绍平台功能以及数据情况;②分类数据库,提供原数据的表格、统计图和地理信息系统(GIS)地图的查看,以及数据下载;③数据整合,根据数据整合规则,对多类数据进行交叉查询,提供查询结果以表格和空间地图方式查看以及结果下载,并提供数据变化监测GIS地图的可视化;④登革热预测预警,根据模型方法,调用平台数据,展现登革热预测结果;⑤相关材料,提供材料的上传下载。
2 结果 2.1 平台介绍国家重要监测数据平台涵盖内容,所拥有的数据和模块见图 3。
2.2 分类数据库就重要病媒生物、重要病媒传染病、重要检疫性入侵生物和气象数据,根据时间、空间范围的设定,输出查询结果表,并针对输出结果,制作统计图和GIS地图(图 4)。就病原微生物名录和生物安全组学数据,采用关键字段,如病毒名进行查询,输出查询结果表。就空间环境数据,如人口和土地利用分类,输出栅格值阈分级图。
2.3 数据整合数据整合功能是平台的核心功能,数据整合实现过程见图 5。在数据查询窗口选定时间范围、空间范围和数据类型(图 5A),得出数据联合查询结果表(图 5B)。根据结果表数据,实现该类数据在该时空范围内变化监测可视化(图 5C)。根据查询结果表数据、生物学属性,查询病原微生物信息(图 5D)和生物安全组学信息(图 5E)。
2.4 登革热预测预警登革热预测预警模块功能的实现贯穿了数据调用、方法选择和模型实现,见图 6。可调用前1个月的蚊虫数据、登革热发病数据、气象数据,预测当月的登革热病例数。图中实例选择2010年1月至2015年12月的数据,根据零膨胀与广义加性模型构建登革热预测模型,并预测2016年1月登革热发病数。
3 讨论根据国家重要监测数据的时间属性、空间属性和生物学属性,建立数据整合规则,为国家重要监测数据的集成、共享、交换等奠定了技术基础;将多源、多尺度、多平台、动态化的国家重要监测数据进行抽取、清洗以及转换形成覆盖面广、结构统一、标准统一、内容完整的“数据中心”,为国家重要监测数据库建设提供强有力的数据基础。以数据整合功能为核心,创建国家重要监测数据整合平台,为病媒及病媒传染病等科学研究提供可靠的数据支持与保障。GIS技术的发展将给国家重要监测数据整合平台提供更多、更新、更优的技术手段。
[1] |
李伟华, 郑彦宁, 刘志辉. 国内外数据整合研究进展分析[J]. 数字图书馆论坛, 2015(6): 54-61. DOI:10.3772/j.issn.1673-2286.2015.06.009 |
[2] |
黄华南. 基于GIS的国土房产数据整合方案设计[J]. 测绘通报, 2007(10): 64-66. DOI:10.3969/j.issn.0494-0911.2007.10.020 |
[3] |
张李军, 刘寿福, 黄东海, 等. 南京市城乡地籍数据整合若干问题探讨[J]. 安徽农业科学, 2015, 43(1): 295-297. DOI:10.3969/j.issn.0517-6611.2015.01.101 |
[4] |
荣芳. 基于数据整合的地籍信息系统设计与实现[J]. 地理空间信息, 2015, 13(6): 36-37, 43. DOI:10.3969/j.issn.1672-4623.2015.06.012 |
[5] |
刘志杰, 金秉福, 张瑞端, 等. 海底沉积物碎屑矿物数据整合技术研究[J]. 海洋通报, 2015, 34(6): 657-662. DOI:10.11840/j.issn.1001-6392.2015.06.008 |
[6] |
Ma Z, Hart MM, Redmond RL. Mapping vegetation across large geographic areas:integration of remote sensing and GIS to classify multisource data[J]. Photogramm Eng Remote Sens, 2001, 67(3): 295-307. |
[7] |
李勇, 包世泰, 周品, 等. ECDIS与GIS数据集成研究[J]. 测绘科学, 2007, 32(4): 135-137. DOI:10.3771/j.issn.1009-2307.2007.04.050 |
[8] |
Karnatak HC, Shukla R, Sharma VK, et al. Spatial mashup technology and real time data integration in geo-web application using open source GIS-a case study for disaster management[J]. Geocarto Int, 2012, 27(6): 499-514. DOI:10.1080/10106049.2011.650651 |
[9] |
Salleh SA, Hamid JRA, Ariffin IM. Investigation of potential integration of spectroradiometer data with GIS technology:the spectro-GIS tools[J]. IOP Conf Ser Earth Environ Sci, 2014, 18(1): 012053. DOI:10.1088/1755-1315/18/1/012053 |
[10] |
Goble C, Stevens R. State of the nation in data integration for bioinformatics[J]. J Biomed Inform, 2008, 41(5): 687-693. DOI:10.1016/j.jbi.2008.01.008 |
[11] |
Seoane JA, Aguiar-Pulido V, Munteanu CR, et al. Biomedical data integration in computational drug design and bioinformatics[J]. Curr Comput Aided Drug Des, 2013, 9(1): 108-117. DOI:10.2174/15734099112089990011 |
[12] |
Fagan A, Culhane AC, Higgins DG. A multivariate analysis approach to the integration of proteomic and gene expression data[J]. Proteomics, 2007, 7(13): 2162-2171. DOI:10.1002/pmic.200600898 |
[13] |
Rezola A, Pey J, Tobalina L, et al. Advances in network-based metabolic pathway analysis and gene expression data integration[J]. Brief Bioinform, 2015, 16(2): 265-279. DOI:10.1093/bib/bbu009 |
[14] |
de la Prieta F, Rodríguez S, Bajo J, et al. Data integration in cloud computing environment[C]//Proceedings of the 4th International Workshop on Knowledge Discovery, Knowledge Management and Decision Support. Mazatlan, Mexico: Atlantis Press, 2013: 180-185.
|
[15] |
邹晓妮, 吴菲, 李静静, 等. 医院内法定传染病信息推送平台开发与实现[J]. 中国卫生信息管理, 2014, 11(6): 596-601. |
[16] |
李梅, 苗润莲, 张岸, 等. 基于GIS的京津冀科技资源数字地图服务平台构建[J]. 现代情报, 2017, 37(6): 172-177. DOI:10.3969/j.issn.1008-0821.2017.06.028 |
[17] |
唐健, 沈陈华, 周国峰, 等. 国土资源数据整合方案设计及其实现研究[J]. 中国土地科学, 2009, 23(9): 72-78. DOI:10.3969/j.issn.1001-8158.2009.09.014 |