中国生物工程杂志  2017, Vol. 37 Issue (11): 37-44

文章信息

闫鹏程, 张占江, 裴智勇, 付延婷, 陈禹保, 刘彤.
YAN Peng-cheng, ZHANGY Zhan-jiang, PEI Zhi-yong, FU Yan-ting, CHEN Yu-bao, LIU Tong.
药用植物保育云服务平台设计与实现
Design and Realization of Cloud Platform for Medicinal Plant Conservation
中国生物工程杂志, 2017, 37(11): 37-44
China Biotechnology, 2017, 37(11): 37-44
http://dx.doi.org/DOI:10.13523/j.cb.20171106

文章历史

收稿日期: 2017-06-02
药用植物保育云服务平台设计与实现
闫鹏程1 , 张占江2 , 裴智勇1 , 付延婷1 , 陈禹保1 , 刘彤1     
1. 北京市计算中心生物计算事业部 云计算关键技术与应用北京市重点实验室 北京 100094
2. 广西壮族自治区药用植物园 南宁 530023
摘要: 药用植物资源是中医药事业和生物医药产业赖以生存和发展的重要资源,同时也是我国的中医药文化遗产的载体。而药用植物资源的保育工作是药植资源可持续性开发与应用的基础。随着生物信息学与信息化技术的快速发展,利用包括云计算在内的新兴信息化技术,在传统种质资源保护与管理等方面的应用越来越多,然而,在药用植物资源保育方面还有待开发与应用。利用云计算、数据库应用及生物信息学等相关技术,对我国药用植物资源的保育数据进行信息化及平台建设,构建药用植物保育云服务平台系统。该系统通过收集、整理和加工药用植物资源信息,开展药用植物数据信息化与应用开发,完成药用植物保育云服务平台,可提供药用植物保护及新物种培育等方面信息查询服务。该平台对于药用植物研究相关的数据标准化、保育学科研究,以及信息共享与服务,具有较为重要的应用价值与社会意义。
关键词: 药用植物     保育     云平台     Web应用     生物信息学    
Design and Realization of Cloud Platform for Medicinal Plant Conservation
YAN Peng-cheng1, ZHANGY Zhan-jiang2, PEI Zhi-yong1, FU Yan-ting1, CHEN Yu-bao1, LIU Tong1     
1. Department of Computational Biology in Beijing Computing Center, Beijing Key Laboratory of Cloud Computing Key Technology and Application, Beijing 100094, China;
2. Guangxi Zhuang Autonomous Region Medicinal Botanical Garden, Nanning 530023, China
Abstract: Medicinal plants are important resources for the development of traditional Chinese medicine and biomedical industry. They are also the carrier of traditional Chinese medicine cultural heritage. The conservation of medicinal plants is the basis of their sustainable development and application. With the rapid development of bioinformatics and information technology, there are more and more applications of them, including cloud computing, in the protection and management of traditional germplasm resources. However, their applications in the conservation of medicinal plant resources remain to be developed. A cloud platform system for medicinal plant conservation in China is constructed. In this system, cloud computing, database applications, bioinformatics and other related technologies were used. By collecting, sorting and processing the information of medicinal plant resources, carrying out the information and application development, this system could provide information inquiry service for medicinal plant protection and cultivation of new species. This platform has important application value and social significance for the standardization of data related to medicinal plant research, conservation subject research, and information sharing and service.
Key words: Medicinal plant     Conservation     Cloud platform     Web application     Bioinformatics    

药用植物是指含有药用或保健成分的植物,大多数中草药都属于药用植物。我国药用植物的利用开发有着悠久的历史,随着科学和社会的进步、医疗卫生和保健事业的发展,药用植物资源的研究和开发得到大力发展。尤其是近几年来,以传统医药为核心的药用植物资源开发和利用也越来越受到广泛的重视。我国地域辽阔,药用植物资源极为丰富,现有记载的药用植物包括383科, 2 309属,11 146种[1]。其中西南地区的药用植物资源尤为丰富,占全国总数的60%~70%。由于中医药产业的迅速发展导致药用植物资源开发过度,生物多样性遭到破坏,有相当一部分珍稀药用植物资源濒临灭绝。因此保护我国丰富的药用植物迫在眉睫,合理开发和利用药用植物资源刻不容缓[2]

从基础植物学研究角度,药用植物有物种分类、形态特征、解剖特性和生理功能、药材种植培育、生长发育、遗传育种等方面的特征属性;从传统中医药和药物角度看,药用植物具有药材产地和资源、入药部位、药材加工、药材特征鉴别、药物性能和药理作用、活性成分、化合物结构等特征属性;从现代中医药研究角度,药用植物具有功能基因信息、活性成分研究、药用成分鉴定、药物作用靶点、DNA条形码等特征属性[3]。以上研究数据在药用植物研究、鉴定以及医药研发领域至关重要,系统的收集管理这些数据,可以鉴定中药的原植物种类,确保药材来源的道地性和药材质量;可以从分子生物学的角度阐明药用植物的有效成分和作用机制;同时也为药用植物资源的合理利用和保护奠定基础,对育种和栽培都有很重要的意义。

据统计,目前国内外已建成的近百个药用植物相关数据库中,主要以文字描述性数据库为主,主要是偏重基础数据的收集整理、地域型药用植物的收集,整合性的基础信息类数据库不多,基本没有药用植物的生物信息学数据,且难以反映植物多样性和环境因子在多维空间上的内在联系,再加上国内外地域和文化差异的不同导致各个数据库数据格式、结构各异,信息整合及统一非常困难[4]

因为缺乏一个统一的、规范的、综合性的药用植物资源相关的信息化平台,生物医药企业、科研用户和从事与药用植物相关工作或有相关爱好的大众用户大多只能通过最原始的人际关系网来获取药用植物资源相关信息,中药行业建设的主力军药农、药材收购站、药企之间,以及与具有高精尖人才的中药材科研机构之间没有直接的信息互通渠道,导致产学研合作不紧密。同时,在已有和正在建设的药用植物信息系统之间,也没有做到不同系统的资源对接,各系统都处于一个信息孤岛的状态,药用植物行业的相关人员往往很难得到研究所需的数据资源,不能全面、及时地了解药用植物的发展动态,在很多情况下不得不进行重复工作,不仅造成了时间和资源的浪费,而且使得数据的可信度、完整性、权威性得不到保障,因此亟须建设一个统一、规范、综合性的,能够支撑药用植物信息查询、药用植物遗传育种咨询、药用植物信息数据分析等功能的药用植物保育云服务平台,用于信息的交流与共享[5]

1 药用植物保育云服务平台总体设计

药用植物保育云服务平台与广西壮族自治区药用植物园合作,以药用植物园独特的药用植物资源和药用植物保育功能为基础开展平台设计和建设。根据药用植物园业务和数据情况,结合药用植物特点进行药用植物资源数据整理。

1.1 平台功能需求分析

以药用植物园为基础的药用植物保育和数据管理,主要分为3个部分。

(1) 以药用植物保育为主要目的的数据管理,针对平台内药用植物资源的数字化采集、加工与管理工作。具体包括:物种信息的录入、删除、修改、查询和发布操作。可对数据进行批量备份,导入/导出操作等;一般情况下,植物基因相关的数据容量比较大,几到几十个GB,系统需要提供专门FTP传输端口进行数据批量导入和导出及备份。药用植物物种分类管理,将所有药用植物都在“种”的级别上进行分类。

(2) 平台信息管理,通过设置专家用户,对药用植物保育云服务平台数据库的数据进行专业的鉴定评估,将修改意见反馈给数据库管理员,由其决定是否采纳,以保障药用植物信息的准确性和高可信度。管理员参考专家的建议,评估数据库中的信息是否需要更改或发布。管理员有专门的接口接收和回复专家的鉴定评估建议,可对数据进行批量备份、导入/导出操作,同时能够查看数据库日志,以便数据库的维护。

平台信息管理还包括平台用户管理,包括用户注册、用户权限管理和用户信息管理。平台用户角色分为两种,平台管理员和平台使用用户,使用用户包括药用植物医药中小企业及科研机构的研发人员、药农/药商、大众用户;管理用户是指系统管理员、数据库管理员和需要对药用植物信息进行鉴定评估的专家用户。

(3) 站点信息发布与互动管理,主要针对药用植物信息相关的通知、公告及市场信息的发布与管理。系统管理员可登录后台,通过已有频道,手动录入相关信息,数据可以随时录入随时更新,系统管理员可手动发布也可系统定时发布更新信息。

1.2 平台数据需求分析

药用植物物种信息包括药用植物名称、分类信息、形态特征、特性描述、产地与资源分布、药用信息、保育信息、图像信息、文献信息、基因组信息10个一级分类共52个字段信息。物种分类遵循生物学分类原理和方法,即采用现代生物分类学,按照界、门、纲、目、科、属、种的七级分类学方法,在“种”的水平上,对遴选的100种药用植物进行“种”级分类、实现分类编码及信息录入。

药用植物种子数据库构建按照药用植物园种子信息管理的内容登记采集信息、登记信息、质量检验信息、萌发实验信息、入库信息、出库信息6个一级分类共111个字段建立种子信息数据库,按照数据库建库规范和优化措施,为种子库设计合理数据结构和表格字段,设置合理的主键、外键及索引等信息,建立数据与实体之间的联系,不断优化数据库结构,便于数据的检索和浏览。

药用植物基因组数据库构建按照物种序列、基因、功能注释、代谢通路、药物作用蛋白靶点、基因组信息、文献信息7个一级分类的28个字段设计基因数据库结构和表格存储数据库。

专家信息库构建按照收录的专家信息和数据库建库规范设计合理的表格和结构存储收集、整理的国内药用植物保育领域相关的副高以上职称专家信息,内容包括专家姓名、专家编号、专家照片、任职单位、专业、研究方向、科研成果、联系电话、电子邮件等10个字段信息。

1.3 药用植物保育云服务平台整体框架设计

药用植物保育云服务平台整体功能框架如图 1所示,基础设施层由北京“工业云”服务平台已有的资源提供,主要由服务器、存储和网络等基础设施组成;数据存储层主要由药用植物种质数据库、种子数据库、基因数据库和专家库组成,数据处理层包括数据分析、数据整合、数据格式转换、数据更新等数据处理内容的设计与实现以及与数据库相衔接的统一数据采集格式和接口规范的制定;系统管理层将包括药用植物相关的4类信息管理、用户管理、专家鉴定评估管理、站点信息发布和互动管理、数据访问管理等;应用服务层将通过门户网站面向平台的用户提供药用植物相关信息浏览与查询、专家咨询服务、资讯信息浏览及数据访问服务。

图 1 药用植物保育云服务平台整体框架 Figure 1 Outline of cloud platform for medicinal plant conservation

1.3.1 数据存储层

药用植物保育云服务平台的数据存储主要包括药用植物多层面信息数据库和药用植物领域专家信息数据库的建设,还包括与公共生物信息和基因数据库的数据对接。平台采用MySQL关系数据库存储数据。

1.3.2 数据处理层

数据处理层包括药用植物相关数据信息(物种、种子及基因信息)的采集,数据的分析与整合,数据传输格式转换,数据备份与更新和接口规范。其中数据采集与接口规范包括数据采集、数据加工分析、数据录入、数据传输及接入设备访问等方面的数据标准与接口规范等。

1.3.3 平台管理层平台管理层

主要包括药用植物保育云服务平台的数据信息管理、专家鉴定评估管理、用户管理、站点管理和传输管理。数据信息管理,主要针对平台内药用植物的物种、种子与基因组数据的数字化采集、加工与管理工作;专家鉴定评估管理,对药用植物保育云服务平台数据库的数据进行专业的鉴定评估,将修改意见反馈给数据库管理员,由其决定是否采纳,主要目的保障药用植物信息的准确性和高可信度。

1.4 门户网站

药用植物保育云服务平台的门户应用服务层,利用云平台对保育云信息系统收集的药用植物物种信息、种子信息、基因信息、专家信息、市场资讯5类信息等数据进行汇总、存储、分类、加工、分析等处理,提供药用植物信息浏览/查询、专家信息浏览/查询、资讯浏览、数据上传/下载、专家咨询及大众科普等服务。

2 药用植物保育云服务平台功能实现 2.1 平台云服务基础设施建设

药用植物保育云基础平台包括云主机、云存储、虚拟化软件、云资源管理软件、应用容器、Web前端服务器、应用程序服务器、数据库服务器等计算、存储、网络资源及相关功能模块,为药物植物数据信息化提供最基础的计算及存储资源。药用植物保育云平台依托北京市计算中心的计算资源作为基础设施,将Web前端服务器、应用程序服务器、数据库服务器制作成私有虚拟机模板分配在一套虚拟云设备上,利用SDN方式提供负载均衡功能及安全防护,并通过云主机的实时网络与应用程序监控功能实现系统的高可靠性,如图 2所示。平台可随时根据业务量的需求添加虚拟机的数量,如当遇到访问高峰可及时增加虚拟机的数量,以保证客户的体验。

图 2 药用植物保育云服务平台系统架构 Figure 2 Architecture of cloud platform for medicinal plant conservation
2.2 平台系统开发

药用植物保育云服务平台采用Java语言开发,使用目前最主流的J2EE开发框架,具有卓越的通用性、高效性、平台移植性和安全性。平台框架以Spring Framework为核心、Spring MVC作为模型视图控制器[6]、Hibernate作为数据库操作层[7]、MetroNic Bootstrap作为前端展示,此组合是Java界业内最经典、最优的搭配组合,兼容业界几乎全部的浏览器、操作系统、数据库和中间件。

按照分层设计原则,平台分为6个分层进行开发,分别为数据库层、数据访问层、业务处理层、数据控制层、视图层和数据展示层,层次清楚,低耦合,各层必须通过接口才能接入并进行参数校验,保证数据操作的安全。此外,分层开发的框架中还对常用工具进行封装,包括日志工具、缓存工具、服务器端验证、数据字典、当前组织机构数据以及全文搜索、文档操作和中文分词等其他常用小工具,如图 3所示。

图 3 药用植物保育云服务平台系统框架 Figure 3 System framework of cloud platform for medicinal plant conservation

为了平台安全考虑,我们对用户表单提交所有数据进行双验证:包括服务器端验证及客户端验证,防止用户通过浏览器恶意修改,跳过客户端验证操作数据库。数据在服务器端都进行安全编码,防止用户提交非法脚本及SQL注入获取敏感数据等,确保数据安全。系统对所有管理端链接都进行用户身份权限验证,防止用户直接通过URL进行未授权页面。

3 药用植物保育云平台应用

开发完成的药用资源建设与应用开发平台系统,会员用户可以通过网络访问http://117.121.38.106/进入系统页面,通过直观的操作界面随时进行查询。

3.1 药用植物保育云平台首页

游客用户可从首页查看新闻资讯,了解中医药相关知识、育种知识等。普通用户可以通过前端系统的注册页面,提交相应信息,自主注册。注册成功后,输入正确的用户名和密码后,可登录到系统。具体页面如图 4所示。

图 4 药用植物保育云平台首页 Figure 4 Home page of cloud platform for medicinal plant conservation
3.2 药用植物保育云服务平台查询系统

各级注册用户,可以在药用植物保育云服务平台查询系统对开放数据进行检索和查询,查询页面如图 5所示。查询系统分为药用植物种子信息查询、标本查询、基因查询、文献查询和专家在线咨询5个功能,根据用户系统的权限检索特定数据库中的信息。以种子查询为例,用户可以使用快速查询,检索主要关键词。用户也可以使用高级检索功能,设定多种检索条件和关键词进行精确检索。

图 5 药用植物保育云信息查询系统 Figure 5 Query system of cloud platform for medicinal plant conservation

在线咨询模块可以让用户提交相关问题,系统自动根据问题种类匹配对应专家进行答疑。点击导航菜单中“在线咨询”,即可进到会员在线咨询提交界面。

3.3 药用植物保育云平台管理系统

药用植物保育云平台各级管理人员可以通过管理系统施行整个平台的管理功能,登录页面如图 6所示。此外,药用植物保育云平台管理系统中还包含很多应用服务功能。系统对不同角色的用户设定不同的管理权限。其中,数据管理人员,进入系统可以进行药用植物数据的录入和管理。按照系统定义的信息采集流程对药用植物物种信息、种子信息、基因信息、中药标本资源信息的录入、审核、管理和查询。其中药用植物信息查询功能又细分为种子信息查询、中药标本查询、基因信息查询和文献信息查询。核心数据会根据保密级别设定查询权限。

图 6 药用植物保育云信息管理系统 Figure 6 Management system of cloud platform for medicinal plant conservation

专家用户登录进入管理系统可以对录入信息进行审核、修订,并对专业问题进行答疑。

系统管理员登录进入后,可以对所有系统功能和系统用户进行管理。例如,对系统用户进行新增、修改、删除、审核、重置密码等管理操作。此外还有地域管理、日志管理等功能。

4 总结与展望

本工作主要完成药用植物保育与信息化平台的建设工作,实现了基础药用植物的保育信息录入、收集整理、数据库构建、云平台应用开发等工作任务。关于长远的建设目标,在未来的工作中,我们将继续分层次、分阶段开展相关的研究与平台建设工作,预计下一期中,会在现工作的基础上,增加药用植物的种类和数量,力争达到500种左右,逐步实现药用植物地理信息、三维展示等内容的整合,进而建成内容完善、功能丰富的药用植物保育应用服务平台。药用植物保育云平台建设具有重要科研价值和社会意义。

参考文献
[1]
张惠源, 袁昌齐, 孙传奇, 等. 我国的中药资源种类. 中国中药杂志, 1995, 20(7): 387-390.
Zhang H Y, Yuan C Q, Sun C Q, et al. Resources of Chinese materia medica in China. China Journal of Chinese Materia Medica, 1995, 20(7): 387-390.
[2]
丁建, 夏燕莉. 中国药用植物资源现状. 资源开发与市场, 2005, 21(5): 453-454.
Ding J, Xia Y L. Present situation of chiness medicinal plant resources. Resource Development & Market, 2005, 21(5): 453-454.
[3]
萧伟, 陈凤龙, 章晨峰, 等. 国内外天然药物研究的发展现状和趋势. 中草药, 2009, 40(11): 1681-1687.
Xiao W, Chen F L, Zang C F, et al. Actuality and new trend on research of natural medicines in China and overseas. Chiness Traditional And Herbal Drugs, 2009, 40(11): 1681-1687. DOI:10.3321/j.issn:0253-2670.2009.11.001
[4]
徐妍, 臧绍刚. 野生植物资源信息检索数据库的建立和使用. 山地农业生物学报, 2000, 19(6): 457-459.
Xu Y, Zang S G. Establishment and application of information retrieval database of wild plant resources. Journal of Mountain Agriculture and Biology, 2000, 19(6): 457-459.
[5]
徐宏发, 蒋志刚. 中国药用动植物资源保护和可持续利用. 上海: 华东师范大学出版社, 2003.
Xu H F, Jiang Z G. Conservation and Sustainable Utilization of Medicinal Plant Resources in China. Shanghai: East China Normal University Press, 2003.
[6]
Ladd S, Davison D, Devijver S, 等. 深入解析Spring MVC与Web Flow. 徐哲, 沈艳, 译. 北京: 人民邮电出版社, 2008.
Ladd S, Davison D, Devijver S, et al. Expert Spring MVC and Web Flow. Xu Z, Shen Y. Beijing:Posts & Telecom Press, 2008.
[7]
夏昕, 曹晓钢, 唐勇. 深入浅出Hibernate. 北京: 电子工业出版社, 2005.
Xia X, Cao X G, Tang Y. Head First Hibernate. Beijing: Publishing House of Electronics Industry, 2005.