基于土地利用回归模型的登革热疫情与社会环境要素的空间关系研究
  中国媒介生物学及控制杂志  2018, Vol. 29 Issue (3): 226-230, 234

扩展功能

文章信息

郑斓, 李乔玄, 任红艳, 施润和, 白开旭, 鲁亮
ZHENG Lan, LI Qiao-xuan, REN Hong-yan, SHI Run-he, BAI Kai-xu, LU Liang
基于土地利用回归模型的登革热疫情与社会环境要素的空间关系研究
Exploring the relationship between dengue fever epidemics and social-environmental factors using land use regression model
中国媒介生物学及控制杂志, 2018, 29(3): 226-230, 234
Chin J Vector Biol & Control, 2018, 29(3): 226-230, 234
10.11853/j.issn.1003.8280.2018.03.002

文章历史

收稿日期: 2018-01-30
网络出版时间: 2018-04-11 14:12
基于土地利用回归模型的登革热疫情与社会环境要素的空间关系研究
郑斓1,2,3,4, 李乔玄2, 任红艳2, 施润和1,3,4, 白开旭1,3,4, 鲁亮5     
1 华东师范大学地理信息科学教育部重点实验室, 上海 200241;
2 中国科学院地理科学与资源研究所, 资源与环境信息系统国家重点实验室, 北京 100101;
3 华东师范大学地理科学学院, 上海 200241;
4 华东师范大学环境遥感与数据同化联合实验室, 上海 200241;
5 中国疾病预防控制中心传染病预防控制所, 传染病预防控制国家重点实验室, 北京 102206
摘要: 目的 探究社会经济与自然环境要素对登革热疫情空间分布的影响,为有效防控登革热提供依据。方法 以蚊媒监测点周围0.5~6.0 km范围内的土地利用、人口密度和道路密度等社会环境要素作为土地利用回归(LUR)模型的输入变量,分析广州市社会经济因素对登革热疫情空间分布的影响。采用留一交叉检验法对模型进行检验,即用n—1个样本建立回归方程,计算剩余1个样本的预测值,并与该样本的实测病例数进行比较。结果 监测点不同范围内的社会环境变量对登革热疫情空间分布的贡献程度存在差异,半径为6、2、1、1和2 km缓冲区内的人口密度、道路密度、耕地、林地和农村居民用地的面积分别对登革热1 km有明显影响(R2=0.567、0.512、0.275、0.106和0.041),而整体LUR模型调整R2为0.648(F=55.944,P<0.01),预测值与实测值间的拟合精度达0.728 8,总体水平较好。结论 社会经济要素在不同研究范围下对登革热疫情空间分布的影响不同,LUR模型可较好地预测登革热病例空间分布,从而为当地卫生部门防控登革热提供方法支持。
关键词: 登革热     空间分布     土地利用类型     人口密度     路网     广州市    
Exploring the relationship between dengue fever epidemics and social-environmental factors using land use regression model
ZHENG Lan1,2,3,4, LI Qiao-xuan2, REN Hong-yan2, SHI Run-he1,3,4, BAI Kai-xu1,3,4, LU Liang5     
1 State Key Laboratory of Geographic Information Science, Ministry of Education, East China Normal University, Shanghai 200241, China;
2 State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences;
3 School of Geographic Sciences, East China Normal University;
4 Joint Laboratory for Environmental Remote Sensing and Data Assimilation, ECNU & CEODE Ministry of Education, East China Normal University;
5 State Key Laboratory of Infectious Disease Prevention and Control, National Institute for Communicable Disease Control and Prevention, Chinese Center for Disease Control and Prevention
Supported by the National Natural Science Foundation of China (No. 41571158), the National Key Research and Development Plan (No. 2016YFC1201305-03, 2016YFC1302602) and the Shanghai Municipal Commission of Health and Family Planning (No. 15GWZK0201)
Corresponding author: REN Hong-yan, Email: renhy@igsnrr.ac.cn.
Abstract: Objective Exploring the influence of socioeconomic factors and environmental conditions on the spatial distribution of dengue fever epidemic is an important basis for effective prevention and control of dengue fever. Methods Predictive variables, included land use data, road density and population density, were involved in modeling within different buffer zone ranges from 0.5 km to 6.0 km, which were established and verified on 150 mosquito monitoring sites. The effects of social and economic factors on the distribution of dengue fever in Guangzhou area were analyzed. Results The results found that dengue fever was significantly correlated with human population density (R2=0.567), road density (R2=0.512), farmland area (R2=0.275), forest area (R2=0.106), and village area (R2=0.041)within the buffer zones of 6, 2, 1, 1, and 2 km. The land use regression (LUR)model with these five variables possessed satisfactory capability of predicting the spatial distribution of dengue fever with the adjusted R2 (0.648)and an appropriate F value 55.944 (P < 0.01). The overall result of the model is good with the fitting accuracy between the predicted value and the measured value (0.728 8). Conclusion The socioeconomic factors have different effects on the spatial distribution of dengue fever epidemics in different ranges. LUR has good ability to predict the spatial distribution of dengue fever and provide an effective method for local public health authorities to allocate precise preventing and control measures.
Key words: Dengue fever     Spatial distribution     Land use and cover change     Population density     Road density     Guangzhou city    

登革热是由登革热病毒引起、主要由伊蚊传播的急性传染病,广泛分布在热带及亚热带地区。全球每年约5 000万例患者且近年来趋于活跃[1]。我国自20世纪80年代在广东省首次暴发登革热疫情以来[2],不间断地流行,进入21世纪后其流行范围进一步扩大。根据国家疾病预防控制信息系统数据显示,我国2014年登革热病例数(约4.5万例)为过去10年累积病例数的6.55倍,已成为我国南方地区重要的输入性传染病。

有研究表明,登革热病毒的繁殖与生存、蚊虫孳生与活动、人-蚊接触所需的条件除受区域自然环境影响外[3-6],还与土地利用、住房密度、道路密度和人口密度等社会因素密切相关[7-9]。刘文华等[10]利用人诱法研究表明,清远市建筑、人口密度和交通道路面积比例迅速增加,导致蚊虫种群密度上升并引起伊蚊叮刺概率增加;张浩等[11]和Qi等[12]通过研究媒介生物对登革热病毒的影响,发现城市化影响登革热的传播;这些研究均表明区域内下垫面结构对媒介生物的生存和繁衍产生影响,从而影响疫情的空间分布。此外,国内外许多研究尝试建立数学统计模型探究社会经济要素对登革热疫情空间分布的影响,如Nakhapakorn和Tripathi[13]通过多元回归对土地利用与登革热发病率进行分析发现,建成区对登革热疫情影响最大,而登革热发病率在农业区域处于中等风险;Qi等[12]在珠江三角洲(珠三角)地区街道/乡镇尺度的基础上采用广义相加模型(GAM)分析登革热疫情与社会经济和环境要素间的非线性影响,结果表明,较高的人口密度和道路密度可能导致登革热病例的增加[12]。以往研究仅考虑单一研究尺度,而忽略不同空间范围内环境要素对登革热空间分布的影响。因此,以广州市为研究区,通过构建土地利用回归(land use regression,LUR)模型探究登革热疫情在不同研究范围内与城市下垫面的土地利用、人口和交通间的关系,同时探讨模型在模拟登革热空间分布的可行性与精确性,为城市化水平较高地区开展传染病流行的风险预测与防范研究提供新方法。

1 材料与方法 1.1 研究区概况

广州市位于广东省中南部(112°57′~114°0′E,22°34′~23°57′N),地处珠三角腹地,是珠三角地区的政治经济中心。改革开放以来,广州市城乡建筑用地迅速扩张,大量自然下垫面转换为不透水面,改变区域水热平衡,引起植被、水质等改变[14];同时人口不断聚集和流动人口的增加为区域传染病的传播提供极佳条件,导致登革热肆意蔓延,是近年来登革热疫情的“热点”区域。

1.2 数据来源 1.2.1 疫情数据

登革热疫情资料采用广州市2014年9月经过脱敏处理后的登革热病例资料,数据来源于中国疾病预防控制信息系统。

1.2.2 蚊媒监测数据

蚊媒数据通过与疫情同期的布雷图指数(BI)表示,蚊媒监测数据来源于广州市CDC常规蚊媒监测体系(图 1)。

图 1 广州市150个蚊媒布雷图指数监测点分布 Figure 1 The distribution of 150 Breteau index monitoring points in Guangzhou, China
1.2.3 社会环境数据

本研究中选取土地利用、道路密度和人口密度3类可反映研究区社会环境特征的空间分布数据[12]:土地利用数据来源于中国科学院资源和环境科学数据中心(RESDC),土地利用分类采用RESDC的土地利用覆盖分类体系,并选取耕地、林地、水域、城镇用地、农村居民用地和其他建设用地作为输入变量;而在道路数据的选取上,相比于高速、主干道、国道等主要干道,城市内部居民人口流动量较大的支路、小路可能对蚊虫密度、登革热疫情影响更大。因此,本研究选取县级以下的道路数据,并以道路密度(km/km2)作为输入参数。人口数据来源于RESDC,分辨率为1 km×1 km的人口空间格网数据。

1.3 LUR多元回归建模 1.3.1 LUR多元回归建模

LUR模型作为一种简单有效的多元回归模型在环境与健康研究领域应用较为广泛。本研究的多元回归建模采用后向算法(back algorithm),通过逐步回归的方法依次剔除变量。首先,构建因变量与自变量间的一元线性回归模型,对每个自变量的拟合优度(R2)进行排序并剔除R2贡献<1%的变量;其次,对所有变量进行逐步回归并遵循一定规则剔除变量。例如:①所有变量的系数符号均符合先验假定;②在显著水平下满足t检验;③通过共线性诊断,使模型收敛且获得足够大的R2(图 2)。

图 2 土地利用回归模型流程 Figure 2 Flow chart of land use regression model
1.3.2 因变量

蚊媒是登革热传播的必要条件,以150个蚊媒监测点为中心,选择一定范围内的登革热病例数作为因变量,由于伊蚊的飞行距离在300~500 m之间,其活动范围在理论上为以蚊媒监测点为中心的1 km范围内,因此本研究选取监测点1 km范围内的登革热病例进行正态分布检验,并进行对数转换。

1.3.3 自变量

可能影响登革热疫情的自然和社会因素均可作为LUR模型的自变量,气温、降雨量等自然因素在广州市内空间分异较小,故选取土地利用、人口密度和道路密度等社会经济要素和监测蚊媒数据的BI作为自变量。为比较登革热疫情与不同地理要素间的关系,LUR模型采用缓冲区分析来刻画不同范围内各变量对登革热病例的影响,本研究以150个监测点为中心建立0.5~6.0 km共7个系列缓冲区[15],并统计不同缓冲区范围内各土地利用类型的面积、人口密度和道路密度(图 2)。

1.3.4 模型验证与模拟

本研究采用留一交叉检验法(Leave-One-Out Cross Validation)对模型进行检验,即用n—1个样本建立回归方程,计算剩余1个样本的预测值,并与该样本的实测病例数进行比较。该过程被重复n次,以相对均方根误差(RRMSE)、R2作为模型的评价标准。

2 结果 2.1 变量的贡献分析

利用SPSS 13.0软件的线性回归分别计算各个自变量对因变量的R2贡献值。结果表明,不同环境变量在不同研究范围内对登革热疫情空间分异的贡献差异有统计学意义。道路密度和人口密度分别在监测点2和6 km范围内对登革热疫情的空间分异的影响差异有统计学意义(P<0.01),见表 1图 3显示,广州市中心城区的路网密度远大于其支路的路网密度标准(3~4 km/km2)[16],如此高的道路密度更为登革热疫情的传播提供了有利条件,同时大规模的人口流动也为登革热疫情提供了人-蚊接触环境。

表 1 广州市各环境变量对登革热疫情的R2贡献 Table 1 The R2 contribution of social and environmental variable to dengue epidemics

在各土地类型变量中,耕地和林地的贡献相对较大,且贡献最大值均出现在监测点1 km范围内。这两种土地类型均较适宜伊蚊生存,虽然广州市东北部的耕地及林地人口密度较低(图 3),但两种土地类型在广州市西部与中心城区呈现相互混合现象,城市边缘人口流动量大,近郊林地、耕地等绿色植被水体丰富,利于蚊虫孳生,故易导致疫情暴发[12]

图 3 广州市道路密度及人口密度空间分布 Figure 3 Spatial distribution of road density and human population density in Guangzhou city
2.2 LUR模型分析

从每个变量中选取对R2贡献最大缓冲区范围作为LUR模型的自变量,在所有变量系数的符号均符合先验假定且通过共线性诊断的情况下,得到多元回归方程公式:

式中,Xpop表示人口密度、Xroad表示道路密度、Xvill表示农村居民用地、Xfar表示耕地、Xfore表示林地。回归方程调整R2为0.648(F=55.944,P<0.01),因此,该回归方程具有一定科学意义。从参数检验结果看(表 2),所有自变量均在0.05水平上通过t检验(P<0.05),说明人口密度、道路密度、耕地、林地和农村居民用地分别与登革热疫情有显著的线性关系。

表 2 广州市登革热土地利用回归模型参数检验 Table 2 Parameter estimation test of land use regression model

最后采用留一交叉检验法对模型进行精度评估,结果显示,模型的RRMSE为0.886 3,并对登革热病例数实测值与通过公式计算得到的预测值绘制散点图(图 4),拟合趋势显示,LUR模型的R2为0.728 8,总体水平较好,但模型在疫情低值区的模拟效果相对较差,说明模型模拟效果受疫情特异性影响。

图 4 广州市登革热病例1 km实测值与预测值散点图 Figure 4 Scatter plot of dengue fever monitoring value- predicted value in Guangzhou, China
3 讨论

本研究应用LUR模型探析广州市社会经济要素与登革热疫情间的关系,拓展了LUR模型与方法在登革热疫情中的应用[17-18],尤其在疫情预测方面取得了较好效果,相关疾病控制部门可根据预测结果对潜在暴发疫情区域提前采取有效预防措施,为登革热流行风险预测与防范提供参考。

登革热LUR模型进一步证实了社会经济因素对登革热疫情暴发的重要作用,尤其道路密度与人口密度对登革热疫情的空间分异有显著影响。城市内部街道和建筑间的小路往往是居民区分布的集中区域,室内积水容器较多或卫生状况较差[15],发达的路网促进了人口流动,更易形成适合媒介孳生和人-蚊接触所需的环境而暴发登革热疫情。

除人口和交通因素外,城市下垫面的土地利用也影响登革热的疫情空间分布格局。积水地区和植被覆盖较高的地方均适合伊蚊生存。在有人口流动的耕地、林地和农村居民用地较易形成蚊-人传播所需要的条件。此外,登革热疫情与媒介生存所需的水环境密切相关[19],但本研究中的水域多为大尺度的河湖而非街道尺度上的水浇地;而城镇用地面积与人口密度两变量间存在较强的共线性,易引起模型R2的过度拟合[20];反映伊蚊密度的BI对登革热LUR模型的R2贡献较小,因此BI、水域和城镇用地面积对登革热疫情的贡献在回归方程中并未体现。

综上所述,LUR模型应用于预测登革热疫情空间分布中具有可行性。但本研究在变量选择、模型选择等方面有待改进:(1)登革热疫情空间分布的影响因素复杂,仅采用土地利用、人口、交通等自变量构建模型存在局限性,扩充自变量是当前研究的热点之一,如将街道景观格局、建筑高度以及影响媒介传播的气候、水文等要素加入模型中,以提高模型的精度[20-21]。(2)LUR模型采用线性回归方法对于真实的登革热疫情空间分布具有一定局限性。可加入广义加性模型分析登革热疫情与各影响要素间的非线性关系,在增加更多影响要素后分析比较不同模型的精度与适宜性。(3)LUR模型虽可较好地模拟空间分异情况,但许多研究未考虑时间分异的影响,本研究中的自变量对因变量有滞后作用,因此,构建时空LUR模型可更精确地预测登革热疫情的空间分布[20]

参考文献
[1]
杜建伟, 潘先海. 中国登革热流行概况与流行特征[J]. 中华流行病学杂志, 2010, 31(12): 1429-1433. DOI:10.3760/cma.j.issn.0254-6450.2010.12.025
[2]
熊益权, 陈清. 1978-2014年我国登革热的流行病学分析[J]. 南方医科大学学报, 2014, 34(12): 1822-1825. DOI:10.3969/j.issn.1673-4254.2014.12.24
[3]
李国栋, 张俊华, 焦耿军, 等. 气候变化对传染病爆发流行的影响研究进展[J]. 生态学报, 2013, 33(21): 6762-6773.
[4]
Hales S, de Wet N, Maindonald J, et al. Potential effect of population and climate changes on global distribution of dengue fever:an empirical model[J]. Lancet, 2002, 360(9336): 830-834. DOI:10.1016/S0140-6736(02)09964-6
[5]
Benitez MA. Climate change could affect mosquito-borne diseases in Asia[J]. Lancet, 2009, 373(9669): 1070. DOI:10.1016/S0140-6736(09)60634-6
[6]
Cardoso-Leite R, Vilarinho AC, Novaes MC, et al. Recent and future environmental suitability to dengue fever in Brazil using species distribution model[J]. Trans R Soc Trop Med Hyg, 2014, 108(2): 99-104. DOI:10.1093/trstmh/trt115
[7]
Li Q, Ren H, Zheng L, et al. Ecological niche modeling identifies fine-scale areas at high risk of dengue fever in the Pearl River Delta, China[J]. Int J Environ Res Public Health, 2017, 14(6): E619. DOI:10.3390/ijerph14060619
[8]
Wijayanti SPM, Porphyre T, Chase-Topping M, et al. The importance of socio-economic versus environmental risk factors for reported dengue cases in Java, Indonesia[J]. PLoS Negl Trop Dis, 2016, 10(9): e0004964. DOI:10.1371/journal.pntd.0004964
[9]
岳玉娟, 鲁亮, 刘起勇. 基于遥感-地理信息系统的登革热疫情与环境要素的关系研究[J]. 疾病监测, 2017, 32(6): 458-461. DOI:10.3784/j.issn.1003-9961.2017.06.005
[10]
刘文华, 林立丰, 蔡松武, 等. 广东省清远市快速城市化过程中蚊虫群落动态变化规律[J]. 中国媒介生物学及控制杂志, 2011, 22(6): 561-563.
[11]
张浩, 王春梅, 周元平, 等. 伊蚊传播登革病毒媒介效能的研究进展[J]. 热带医学杂志, 2012, 12(9): 1160-1163, 1170.
[12]
Qi XP, Wang Y, Li Y, et al. The effects of socioeconomic and environmental factors on the incidence of dengue fever in the Pearl River Delta, China, 2013[J]. PLoS Negl Trop Dis, 2015, 9(10): e0004159. DOI:10.1371/journal.pntd.0004159
[13]
Nakhapakorn K, Tripathi NK. An information value based analysis of physical and climatic factors affecting dengue fever and dengue haemorrhagic fever incidence[J]. Int J Health Geogr, 2005, 4: 13. DOI:10.1186/1476-072X-4-13
[14]
吴崧霖. GIS和RS技术在深圳市龙岗区蚊媒传染病监测中的应用研究[D]. 广州: 广东药学院, 2012. http://cdmd.cnki.com.cn/Article/CDMD-10573-1014009388.htm
[15]
Hoek G, Beelen R, de Hoogh K, et al. A review of land-use regression models to assess spatial variation of outdoor air pollution[J]. Atmos Environ, 2008, 42(33): 7561-7578. DOI:10.1016/j.atmosenv.2008.05.057
[16]
黄俊, 蒋乐, 周俊, 等. 《城市道路交通规划设计规范》(GB 50220-95)中有关指标合理性和取值研究[J]. 交通标准化, 2011(8): 18-20.
[17]
张钰娟, 薛凤霞, 白志鹏. 时间调整土地利用回归模型用于孕期空气污染暴露评估的研究进展[J]. 中华预防医学杂志, 2017, 51(3): 265-276.
[18]
Becerra TA, Wilhelm M, Olsen J, et al. Ambient air pollution and autism in Los Angeles county, California[J]. Environ Health Perspect, 2013, 121(3): 380-386.
[19]
岳玉娟, 鲁亮, 刘起勇. 广州市蚊虫密度与土地覆盖类型关系研究[J]. 中国媒介生物学及控制杂志, 2016, 27(2): 99-102.
[20]
吴健生, 谢舞丹, 李嘉诚. 土地利用回归模型在大气污染时空分异研究中的应用[J]. 环境科学, 2016, 37(2): 413-419.
[21]
Tang R, Blangiardo M, Gulliver J. Using building heights and street configuration to enhance intraurban PM10, NOX, and NO2 land use regression models[J]. Environ Sci Technol, 2013, 47(20): 11643-11650. DOI:10.1021/es402156g