中国媒介生物学及控制杂志  2014, Vol. 25 Issue (5): 393-398

服务

文章信息

马爱民,王劲峰,王多全,任周鹏
MA Ai-min, WANG Jin-feng, WANG Duo-quan, REN Zhou-peng
基于最大熵模型的中华按蚊潜在分布预测
Prediction of potential distribution of Anopheles sinensis in China based on MaxEnt
中国媒介生物学及控制杂志, 2014, 25(5): 393-398
Chin J Vector Biol & Control, 2014, 25(5): 393-398
10.11853/j.issn.1003.4692.2014.05.003

文章历史

收稿日期:2014-07-16
基于最大熵模型的中华按蚊潜在分布预测
马爱民1, 王劲峰2, 王多全3, 任周鹏2,4    
1. 中国矿业大学(北京),地球科学与测绘工程学院,北京100083;
2. 中国科学院地理科学与资源研究所, 资源与环境信息系统国家重点实验室; 3. 中国疾病预防控制中心寄生虫病预防控制所;
4. 中国科学院大学
摘要目的 构建中华按蚊潜在分布和生物气候因子关系模型,研究影响中华按蚊潜在分布的主导气候因子,预测中华 按蚊在中国的潜在分布,为在中国消除疟疾提供媒介分布的数据支持。方法 根据2005-2010年媒介按蚊监测数据,应 用最大熵模型(MaxEnt),采用“10%训练存在逻辑阈值”定义最小适生环境阈值,划分中华按蚊的适生区和非适生区。利 用地理信息系统(GIS)估算暴露于中华按蚊分布区内的人群数量。结果 采用受试者工作特征曲线(ROC曲线)分析方 法来检验模型精度,得到的AUC值2005-2010年分别为0.814、0.791、0.783、0.801、0.774和0.802,显示预测精度较好。模 型结果表明,年总降雨量、年平均气压、最湿季降雨量、最冷月最低气温对中华按蚊的分布有着重要影响。结论 2005- 2010年,中华按蚊在中国的潜在分布和暴露人口均呈缩减趋势。掌握并了解中华按蚊在中国的潜在分布,对于中国消除 疟疾和预防相关传染病具有重要意义。
关键词中华按蚊     最大熵模型     地理分布     暴露人口    
Prediction of potential distribution of Anopheles sinensis in China based on MaxEnt
MA Ai-min1, WANG Jin-feng2, WANG Duo-quan3, REN Zhou-peng2,4     
1 College of Geoscience and Surveying Engineering, China University of Mining and Technology, Beijing 100083, China;
2 State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences;
3 The Chinese Center for Disease Control and Prevention of Parasitic Disease Prevention and Control;
4 University of Chinese Academy of Sciences
Abstract:Objective To build a model for the relationship between the potential distribution of Anopheles sinensis and relevant bio-climatic factors, and to identify the main climatic influencing factors as well as predict the potential distribution of An. sinensis in China, thereby providing supporting data of vector distribution for the nationwide elimination of malaria. Methods A MaxEnt model was built to predict the potential distribution of An. sinensis using monitoring data from 2005 to 2010. The potential distribution areas of An. sinensis were divided into suitable and unsuitable areas, where“10 percentile training presence logistic threshold”was used to define the minimum threshold of suitable environment. The size of human population exposed to the distribution area of An. sinensis was evaluated using geographic information system. Results In the MaxEnt model, a receiver operating characteristic (ROC) curve was used to test the precision. The values of area under the ROC curve for 2005 to 2010 were estimated to be 0.814, 0.791, 0.783, 0.801, 0.774, and 0.802, respectively, indicative of good prediction precision. The modeling data showed that total annual precipitation, mean annual air pressure, precipitation of the wettest quarter, and minimum temperature of the coldest month strongly influenced the distribution of An. sinensis. Conclusion In China, the suitable area of An. sinensis and the exposed human population both showed a decreasing trend from 2005 to 2010. It is of great significance to the nationwide elimination of malaria and the prevention of related infectious diseases by grasping and understanding the potential distribution of An. sinensis in China.
Key words: Anopheles sinensis     MaxEnt model     Potential distribution     Exposed population    

疟疾作为世界十大流行病之一[1],广泛分布于热 带、亚热带地区,根据世界卫生组织2013年发布的最 新报告估计,2012年全世界约有2.07亿疟疾病例[2,3,4]。 在中国,建国后的50、60和70年代曾发生3次疟疾大 范围的暴发流行,给工农业生产和居民身体健康造成 巨大危害[5]。疟疾是由传疟媒介传播的,中国最常见 传疟媒介为中华按蚊(Anopheles sinensis[6]。该蚊属半 家栖蚊种,孳生环境十分广泛,并且具有很强的适应 性,稻田、芦苇塘、沼泽地等是中华按蚊的主要孳生环 境[7]。中华按蚊种群数量较大,极易与人接触,引起疟 疾的流行或暴发。对传疟媒介进行监测,了解其生境 的分布变化,才能更好的了解虫媒的种类及其生态习 性,从而预测可能出现的疟疾流行。

在生物生境的潜在分布预测中,生态位模型 (ecological niche models,ENMs)已经被广泛地应用[8,9,10]。 ENMs 是通过已知的物种分布数据和相关的环境变 量,然后运用一定的算法来建立模型,以此来判断生物 生存所需要的生态环境,最后预测出物种在不同时间 和空间上的潜在分布[11]。MaxEnt(Maximum Entropy) 最大熵模型就是一个基于最大熵原理的生态位模型。 最大熵理论的原理是,对于一个随机过程,在没有任何 约束情况下,其分布是均匀的,如果增加约束条件,其 分布状态即发生改变,并且认为事物的分布状态都是 由这些约束条件决定的[9,12]。MaxEnt模型是通过构建 物种已知分布区域和环境变量之间的相互联系,在符 合条件的分布中,将熵最大的分布作为最佳分布[12,13]。 由于MaxEnt模型可以根据相对较少的物种出现点数 据,得到物种潜在分布图,并且预测效果较好[9,14,15],因 此得到广泛应用,目前,MaxEnt模型已经运用于生物 物种保护[10,16,17]、有害物种入侵风险[8,18]、物种适生性 分析[19]等领域。 1 材料与方法 1.1 软件

MaxEnt软件在MAXENT主页(http://www. cs.princeton.edu/~schapire/maxent/)下载,为3.3.3k版本。 GIS软件采用ArcGIS10.2(http://www.esri.com/software/ arcgis)。 1.2 中华按蚊分布数据的收集与处理

中华按蚊的 分布数据来源于中国疾病预防控制中心国家疟疾监测 系统中对中华按蚊等传疟媒介的监测数据。根据疟疾 流行程度与特征分3类地区布设共计62个国家级监测 点,采用夜间室外人饵诱捕法,对中华按蚊等疟蚊进行 诱捕。从2005-2010年的每年6月初至10月初,每半 月进行1次系统全面的媒介按蚊密度监测。在本研究 中,我们整理中华按蚊的存在点数据作为样本数据,并 且将所有样本点数据保存到csv文件中,数据包含三 列——物种名、X、Y坐标值。 1.3 环境数据

气象数据来自中国气象科学数据共 享服务网(http://cdc.cma.gov.cn/home.do)。下载全国 726个气象台站2005-2010年以月为单位的气温、降 雨和气压等数据。采用反距离加权方法(inverse weighted interpolation)将气象数据生成全国1 km×1 km的气象 要素的连续表面数据。为更好地刻画中华按蚊生存的 气候特征,本研究采用WorldClimate(http://www. worldclim.org/bioclim-aml)所提供生物气候变量的计 算方法,将每年插值后的数据重新计算出新的变量,各 变量的含义见表 1。中国行政区划数据来自国家基础 地理信息网站(http://nfgis.nsdi.gov.cn)。

表 1 环境变量含义 Table 1 The definition of environmental variables used for predicting the potential distribution of An. sinensis
1.4 研究方法

将每年的中华按蚊分布数据和环境 数据分别导入到MaxEnt3.3.3k 模型的“Samples”和 “Environmental layers”。随机选取25%的分布数据作 为测试集(test),剩余的75%作为训练集(train)。设置 模型运行3次,模型将根据环境变量和分布点进行模 拟计算出中华按蚊在中国其他地方的适生指数。 MaxEnt模型生成格式为ASCII栅格图层,其每个栅格 的值大小从0到1,代表中华按蚊的适生性,本实验采 用“10%训练存在逻辑阈值”(10 percentile training presence logistic threshold)来定义最小适生环境阈值, 将结果导入ArcGIS10.2,与1∶400万中国行政区划图 叠加,得到中华按蚊在中国潜在分布的分布图。然后 将每年的分布图和以区(县)为基本单元的人口普查地 图叠加,得到每个区(县)中华按蚊的适生区面积占整 个区(县)面积比例,然后乘以区(县)的总人口数[20],本 研究认为人口是均匀分布的,得到每年的暴露人口数。 2 结果 2.1 中华按蚊在中国的潜在分布及暴露人口分析

基于2005-2010 年对中华按蚊的监测数据,利用 MaxEnt方法对中华按蚊在中国的潜在分布进行模拟, 从预测结果图可以看到中华按蚊的适生区主要分布在 第二、三级阶梯内[21],在北部地区北纬40°、中部地区 北纬25°~35°和南部地区北纬20°~25°均是中华按蚊 适生区分布的聚集区(图 1)。将中华按蚊的适生区和 中国人口分布图层叠加,计算得到中华按蚊适生区的 面积和暴露于中华按蚊适生区内的人群数量。中华按 蚊的适生区域2005- 2010 年分别为208.9、209.7、 186.45、199.22、187.34和191.92万km2,其所占国土面 积比例从2005年的22.01%到2010年的20.22%(图 2), 整体上呈现减小趋势。而暴露于中华按蚊分布区内的 人口2005-2010年分别为743.19/100万、724.98/100万、 641.42/100 万、681.13/100 万、685.17/100 万和682.37/ 100万,其所占全国总人口的比例从2005年的57.67% 减少到2010年的52.97%(图 2)。

注:A~F. 代表 2005-2010年中华按蚊的潜在分布图;红色区域表示中华按蚊的适生区,其余表示非适生区;蓝色点表示中华按蚊的出现点。 图 1 中华按蚊在中国的潜在分布 Figure 1 The potential distribution of An. sinensis in China
图 2 2005-2010年中华按蚊暴露区域人口及面积所占比例 Figure 2 The proportions of Chinese population and area exposed to An. sinensis in China,2005-2010
2.2 中华按蚊地理分布与生物气候等因子关系的分 析

本研究中使用刀切法(jackknife test)检测各环境 变量对于影响中华按蚊分布的贡献(图 3),结果显示 在2005-2007年,年总降雨量和平均气压对于中华按 蚊的适生性分布起主要作用,2008年则是最湿季降雨 量和年平均气压起主要作用,而2009、2010年则是最 冷月最低气温和年平均气压有显著作用(表 2图 4)。 从图中可以看出,中华按蚊的适生性随着年总降雨量 的增加,在0~400 mm时集聚上升,然后再平稳的上 升;对于年平均气压,中华按蚊的适生性与其呈正相 关,在100 kPa时,达到峰值,然后平稳;对于最湿季降 雨量,中华按蚊的适生性随着最湿季降雨量的增加,在 0~370 mm时急剧上升,然后平稳;而对于最冷月最低 气温,中华按蚊的适生性与其亦呈正相关关系,在 18 ℃时达到峰值,然后平稳。总的来讲,中华按蚊适 宜生长在温暖湿润的环境中[22,23]

表 2 2005-2010年各环境变量对于中华按蚊分布的 贡献率(%) Table 2 The relative contributions of environmental variables to the distribution of An. sinensis from 2005 to 2010
注:刀切法是指在运行时会产生一系列模型,每一变量被依次排除,并用剩余的变量来建立预测模型(浅蓝色条带);再单独使用每一变量进行建 模(深蓝色条带);另外还会生成1个使用全部变量的模型(红色条带)。Bio2005_dryprec表示2005年的最干季节降雨量;Y2005_totalprec表示2005 年的年总降雨量;其他依此类推。 图 3 基于刀切法的环境变量重要性分析 Figure 3 The Jackknife test and response curves for modeling the distribution of An. sinensis
注:A1、A2~F1、F2依次为2005-2010年最主要的2个变量响应曲线。 图 4 2005-2010年各主要贡献变量的响应曲线 Figure 4 The response curves of main variables from 2005 to 2010
2.3 精度检验

受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)分析方法是目 前物种潜在分布预测模型精度检验中被广泛应用的模 型精度检验方法之一[9,24,25]。AUC(area under the ROC curve)曲线下面积是指ROC曲线与横轴所为的面积, 其值越大表示物种预测模型与环境因子之间相关性越 强,越能判别物种分布的有无,表示模型预测的准确性 越强。一般认为,AUC 值为0.5~0.7,表明准确性较 低,0.7~0.9 表明准确性中等,>0.9 表明准确性较 高[26]。MaxEnt模型在预测结果中直接绘制出ROC曲 线以及给出模型的AUC值,为模型预测效果的判断提 供了方便。本研究所得到的AUC值2005-2010年分 别为0.814、0.791、0.783、0.801、0.774和0.802,显示预 测精度较好,表明本次基于MaxEnt模型预测中华按蚊 在中国潜在分布的研究具有较高的可信度。 3 讨论

基于MaxEnt模型预测中华按蚊在中国的潜在分 布图(图 1),图中显示中华按蚊主要分布在第二、三阶 梯内[21]。究其原因,中国地势总体西高东低,呈阶梯状 分布,有利于来自海洋上的暖湿气流沿着东低西高的 地势爬升,深入内地,带来丰沛的降雨[27],故在第二、三 阶梯内温暖湿润且地势较低,有利于中华按蚊的生长 发育,使之有着广泛的分布,而西北内陆地势较高且气 候干旱、气压较低,不利于中华按蚊的生长。

结合环境变量的响应曲线分析可得,气温、降雨、 气压等均会影响中华按蚊的适生分布[23,28]。气温不仅 可以影响中华按蚊幼虫的存活,而且影响其成虫生长 发育。气温降低,中华按蚊就会停止活动,进入越冬 期;气温升高,就会缩短中华按蚊成虫的发育时间[22]。 充沛的降雨有利于形成湿润环境,利于中华按蚊的孳 生,然而,大量的降雨,比如洪水,则会冲毁中华按蚊的 孳生环境[28]。气压与海拔地势高低有关,地势高气压 低的地方不利于中华按蚊生长。

2005-2010 年,中华按蚊适生区整体呈减小趋 势,但在2008 年有小规模的回升。主要原因是,在 2005年平均气温较常年偏高、降雨偏多[29],较利于中 华按蚊的生长;2006年平均气温偏高、降雨较少,并且 有低温冻害、雪灾等自然灾害[30],使中华按蚊的适生区 有所减小;2007年平均气温偏高,并且降雨空间分布 不均,呈现西部多东部少,而且高温热浪等自然灾害的 发生[31],使得中华按蚊的适生区继续减小;2008年冬 寒、春秋暖、夏多雨的气候特点[32],使得中华按蚊的适 生区有所增加;2009年平均气温偏高、降雨偏少,并出 现近50年来罕见秋旱[33],中华按蚊的适生区继续减 小;2010年平均气温偏高,但是降雨异常偏多[34],使得 中华按蚊适生区稍有增加。

疟疾作为全球最广泛关注也是亟需控制的重要疾 病,是联合国千年发展目标中重点防控的3种传染病 之一[35]。自20世纪80年代以来,我国政府每5年制定 并发布一期《全国疟疾防治规划》[36],取得了瞩目成 就。到2010年,全国疟疾发病人数已降至7855例[37]。 为了响应联合国千年发展目标高级别会议提出的在全 球根除疟疾的倡议,在2010年,我国政府下发了《中国 消除疟疾行动计划(2010-2020年)》,指出到2015年 大部分地区消除疟疾(除云南省边境),到2020年全国 实现消除疟疾的目标[3]。纵观历史,世界上部分地区 成功消除疟疾有效且持久的方法就是通过对传播媒介 的控制。家居环境的改善和居民防蚊意识的提高能够 很好的控制中华按蚊等疟蚊的孳生,进而从根源控制 疟疾的流行。改革开放以来,特别是随着社会主义新 农村建设深入开展,居民生活环境得到很大改善,使得 中华按蚊的孳生地大为缩减;并且随着居民的防蚊意 识提高,蚊香、家用杀虫剂对于中华按蚊的孳生繁殖也 有一定影响。然而,气候变化已经在科学界达成共识, 政府间气象变化专门委员会(IPCC)报告指出,全球平 均气温到2100年将会上升1.5~4.5 ℃。气候变化会 对中华按蚊适生区产生影响,这在一定程度上会影响 我们消除疟疾的目标,值得关注。

参考文献
[1] 丁俊. 疟疾流行现状研究进展[J]. 中国公共卫生,2012,28(5):717-718.
[2] 朱继民,汤林华. 疟疾及其蚊媒的预测方法研究进展[J]. 中国寄生虫学与寄生虫病杂志,2007,25(2):153.
[3] 车河龙,林栋. 疟疾的防控现状及进展[J]. 热带医学杂志,2010,10(2):218-220.
[4] 世界卫生组织. 2013年世界疟疾报告[EB/OL].[2012-12-11].http://www.who.int/zh/.
[5] 刘起勇,刘小波. 媒介按蚊防控:中国疟疾消除的关键措施[J].中国媒介生物学及控制杂志,2010,21(5):409-413.
[6] Chow CY. Malaria vectors in China[J]. Chin J Entomol,1991,6(6):67-79.
[7] 潘波. 我国主要传疟媒介的形态特征、生态习性及传疟作用[J].热带医学杂志,2003,3(4):447-451.
[8] Ward D. Modelling the potential geographic distribution of invasiveant species in New Zealand[J]. Biol Invasions,2007,9(6):723-735.
[9] Elith J,Catherine HG,Robert PA,et al. Novel methods improveprediction of species’ distributions from occurrence data[J].Ecography,2006,29(2):129-151.
[10] 徐卫华,欧阳志云,蒋泽银. 大相岭山系大熊猫生境评价与保护对策研究[J]. 生物多样性,2006,14(3):223-231.
[11] 朱耿平,刘国卿,卜文俊,等. 生态位模型的基本原理及其在生物多样性保护中的应用[J]. 生物多样性,2013,21(1):90-98.
[12] Peterson AT. Uses and requirements of ecological niche models andrelated distributional models[J]. Biodiversity Informatics,2006,3:59-72.
[13] Phillips SJ, Anderson RP, Schapire RE. Maximum entropymodeling of species geographic distributions[J]. Ecol Model,2006,190(3/4):231-259.
[14] Phillips SJ,Dudík M. Modeling of species distributions withMaxent: new extensions and a comprehensive evaluation[J].Ecography,2008,31(2):161-175.
[15] Oliveira SVd,Escobar LE,Peterson AT,et al. Potential geographicdistribution of Hantavirus Reservoirs in Brazil[J]. PLoS One,2013,8(12):e85137.
[16] Tarjuelo R,Morales MB,Traba J,et al. Are species coexistenceareas a good option for conservation management? applicationsfrom fine scale modelling in two steppe birds[J]. PLoS One,2014,9(1):e87847.
[17] Yang XQ,Kushwaha SPS,Saran S,et al. Maxent modeling forpredicting the potential distribution of medicinal plant,Justiciaadhatoda L. in Lesser Himalayan foothills[J]. Ecol Eng,2013,51:83-87.
[18] 王碧. 中国两栖动物锥虫、肝簇虫空间分布风险的MaxEnt模型预测[D]. 哈尔滨:东北林业大学,2012.
[19] Saatchi S,Buermann W,Hans TS,et al. Modeling distribution ofAmazonian tree species and diversity using remote sensingmeasurements[J]. Remote Sens Environ,2008,112(5):2000-2017.
[20] Zhang A,Qi QW,Jiang LL,et al. Population exposure to PM2.5 inthe urban area of Beijing[J]. PLoS One,2013,8(5):e63486.
[21] 蒋捷,杨昕. 基于DEM中国地势三大阶梯定量划分[J]. 地理信息世界,2009,1(1):9-13.
[22] 丁德峻,张旭晖,赵勇进. 温度对我国中华按蚊世代分布及其传疟有效季节的影响[J]. 生态学杂志,1991,2(4):52-57.
[23] 刘小波,刘起勇. 自然与社会因素对传疟媒介按蚊生态习性的影响[J]. 中国媒介生物学及控制杂志,2012,23(1):1-6.
[24] Brotons L,Thuiller W,Araújo MB,et al. Presence-absence versuspresence - only modelling methods for predicting bird habitatsuitability[J]. Ecography,2004,27(4):437-448.
[25] McPherson JM,Jetz W,Rogers DJ. The effects of species’rangesizes on the accuracy of distribution models: ecologicalphenomenon or statistical artefact?[J]. J Appl Ecol,2004,41(5):811-823.
[26] Walther GR,Post E,Convey P,et al. Ecological responses torecent climate change[J]. Nature,2002,416(6879):389-395.
[27] 封志明,唐焰,杨艳昭,等. 中国地形起伏度及其与人口分布的相关性[J]. 地理学报,2007,62(10):1073-1082.
[28] 秦正积,罗超,孟言浦,等. 气温、湿度、降雨量对蚊密度的影响统计分析[J]. 中国媒介生物学及控制杂志,2003,14(6):421-422.
[29] 中华人民共和国环保部. 2005 年中国环境状况公报[EB/OL].[2006-06-02]. http://www.mep.gov.cn/.
[30] 中华人民共和国环保部. 2006 年中国环境状况公报[EB/OL].[2007-06-05]. http://www.mep.gov.cn/.
[31] 中华人民共和国环保部. 2007 年中国环境状况公报[EB/OL].[2008-06-05]. http://www.mep.gov.cn/.
[32] 中华人民共和国环保部. 2008 年中国环境状况公报[EB/OL].[2009-06-09]. http://www.mep.gov.cn/.
[33] 中华人民共和国环保部. 2009 年中国环境状况公报[EB/OL].[2010-06-03]. http://www.mep.gov.cn/.
[34] 中华人民共和国环保部. 2010 年中国环境状况公报[EB/OL].[2011-05-29]. http://www.mep.gov.cn/.
[35] Marco V,Reuben G,Charles FG,et al. The global fight againstHIV/AIDS,tuberculosis,and malaria:current status and futureperspectives[J]. Am J Clin Pathol,2009,131(6):844-848.
[36] 钱会霖,汤林华. 中国50年疟疾防治工作的成就与展望[J]. 中华流行病学杂志,2000,21(3):225-258.
[37] 高琪. 我国消除疟疾面临的机遇与挑战[J]. 中国血吸虫病防治杂志,2011,23(4):347-349.