2. 江苏省疾病预防控制中心
中国结核病发病率排名世界第二,患病率为367/10万左右〔1〕,占全球所有结核病例的15%。近年来,由于耐药问题和结核分支杆菌与艾滋病病毒双重感染以及流动人口的增加,导致结核病的控制难度加大,而且各地分布不均衡,发病下降缓慢〔2, 3〕。地理信息系统(Geographic Infomation SystemGIS)是一种采集、管理和分析空间数据以及可视化空间资料的工具〔4〕,利用其空间分析技术可揭示传染病的空间分布特征,探索病因并进行疾病预测。本研究拟采用GIS技术研究江苏省肺结核发病空间分布特点,并进行相关空间分析,为肺结核的有效防控及资源配置提供理论依据。
1 资料与方法1.1 肺结核疾病数据库从江苏省传染病疫情信息网络直报系统收集2003年1月-2009年12月以县(区)为单位的肺结核发病人数;人口数据来源于全国第5次人口普查。计算各县区2003-2009年肺结核发病率(1/10万)以及年平均发病率后建立疾病数据库。
1.2 基础地图以江苏省1:100万县(市)界矢量地图作为基础地图。利用ArcGIS 9.3软件将整理完善的肺结核发病资料与基础地图上的行政区划进行匹配,建立相应的空间数据库和属性数据库。
1.3 空间分析(1)疾病地图:以各年肺结核发病率及平均发病率资料为基础,通过ArcGIS 9.3软件按照发病率值的高低制成肺结核发病地图。(2)空间自相关分析:空间自相关分析分为全局空间自相关分析与局部空间自相关分析。全局空间自相关是对某一现象在整个研究区域空间特征的描述,例如疾病的聚集状态;局部空间自相关是研究范围内各空间位置与各自周围邻近位置的同一现象的相关性。本次研究采用Moran's I空间自相关分析方法,它是基于Pearson相关系数的广义空间积差相关系数〔5〕。
1.4 趋势面分析趋势面分析将数据的空间变化分解成区域趋势、局部异常和随机误差3个部分。它的实质是进行数据的拟合,因变量为空间位置上的观察值,自变量为空间位置(平面坐标X/Y或者经纬度),令局部变异和随机误差部分的期望为0,两者的协方差也为0,则可获得残差平方和为最小的估计值,该估计值反映了整个区域的趋势。趋势面分析常用的方法是多项式回归模型,即多项式拟合插值〔6〕。本研究应用ArcGIS软件对肺结核数据进行二次多项式拟合插值,得到江苏省肺结核发病的三维立体趋势图。
1.5 空间回归分析空间回归模型或称空间模型,是空间流行病学研究内容之一,它从地理的角度研究疾病发病空间分布与自变量(环境因素如水、空气、土壤等,社会经济学因素等)之间的关系。在传统回归方法中,它加入了随机效应项,来解释可能存在的空间相关性的影响,并进一步明确其相关的保护效应或危险效应。空间统计分析最常用的是空间线性回归模型,通常使用最小二乘法来进行空间回归运算。模型的建立必须满足的条件之一:参与回归的变量残差没有空间自相关性〔7〕。所以在进行最小二乘法回归时,必须对其残差进行空间自相关分析。在ArcGIS中建立回归模型是一个反复的过程,涉及寻找有效的独立变量,解释过程中,需要模拟/理解,然后运行回归工具来确定哪些变量是有效的预测,然后删除/添加变量,直到找到最佳模式。
2 结果根据江苏省结核病发病资料的特征,对各年发病率资料进行了空间显示和趋势分析,结果表明2003-2007年肺结核的空间分布格局和发病趋势与2008-2009年的分布有明显差别,因此有必要将发病数据分为2003-2007年与2008-2009年2个时段进行分析。
2.1 肺结核发病分布图(图 1,2)![]() | 图 1 2003-2007年江苏省肺结核年均发病率空间分布图 |
![]() | 图 2 2008-2009年江苏省肺结核年均发病率空间分布图 |
在ArcGIS桌面窗口ArcMap中将肺结核发病率均分成5个相同等级,并以不同的颜色进行标识,绘制成肺结核年均发病率分布图。从发病地图中可以看出,2003-2007年肺结核的高发地区主要分布在苏中地区的南京六合区、溧水县和高淳县,泰州的姜堰市和泰兴市,南通(市辖区、启东市、通州市、海门市、如东县),以及苏北地区的淮安(市辖区、洪泽县、金湖县、涟水县、盱眙县),徐州新沂市、沛县和宿迁睢宁县等地;其中以淮安盱眙县和镇江丹徒区发病密度最高。2008-2009年高发区域集中在苏北地区的宿迁市和徐州市,苏中地区的南通市、南京市区以及泰州的姜堰市和泰兴市等地呈散在高发。
2.2 空间自相关分析(图 3,4)![]() |
注: 研究区域与邻近区域的发病率取值高高相邻(HH,都大于均 数)或低低相邻(LL,都小于均数)表明发病呈正向空间自相关,相邻 区域具有相似现象。发病率取值高低相邻(HL),表明病呈负向空 间自相关,相邻区域具有不相似现象。 图 3 2003-2007年江苏省肺结核Local Moran’ s I空间自相关分析图 |
![]() | 图 4 2008-2009年江苏省肺结核Local Moran’ s I空间自相关分析图 |
全局Moran's I空间自相关分析结果显示,2003-2007年肺结核空间自相关系数I=0.176,P=0.060,说明肺结核在整个江苏省区域上的自相关关系无有统计学意义,即空间随机分布,但不确定是否存在局部空间自相关;但2008-2009年肺结核在江苏省区域存在明显的自相关(I=0.233,P=0.016),即存在空间聚集状态。将Lo-cal Moran's I空间自相关指数Z值标准化处理后可以得到7个等级:Z值<-2.58S、-2.58S~-1.96S、-1.96S~1.65S的3个空间负相关区域和Z值为1.65S~1.65S的随机分布区域以及Z值为1.65S~196S、1.96S~2.58S、>2.58S的3个空间正相关区域。2003-2007年江苏省肺结核发病形成了7个热点区域,呈正向空间自相关。其中2个为"正热点区域,分别为盱眙县和海门市。这些区域与周围区域疾病分布呈高高相邻,即疾病高发区。另外5个与周边区域疾病分布呈低低相邻,为"负热点区域",为连云港市辖区、灌云县、建湖县以及盐城市区和大丰市,表明肺结核在这些地区呈低流行状态。2008-2009年的局部自相关结果亦指出了7个热点"区域,其中5个"正热点"区域,分别为海门市、启东市、姜堰市、徐州市辖区和邳州市;2个"负热点区域",为连云港市辖区和灌云县。另外睢宁县显示与周边区域发病分布高低相邻,呈负向空间自相关。
2.3 趋势面分析以空间位置上的观察值即肺结核发病率值作为Z轴,以经度和纬度分别作为X轴和Y轴。利用GIS软件的GeostatisticalAnalyst模块操作得到趋势分析的立体趋势图。结果显示2003-2007年和2008-2009年肺结核的地理发病趋势有明显不同。2003-2007年肺结核发病在江苏省自西向东趋势近乎平缓,自南向北则显示略微下降趋势。而2008-2009年肺结核发病的地理趋势则较为明显,自西向东方向呈现U形的先下滑后上升的明显改变趋势,而自南向北方向呈现不明显的先上升后下降趋势。趋势图显示结果与肺结核的空间分布图相一致。
2.4 空间回归分析本研究以LON(经度)和LAT(纬度)为自变量,以肺结核年均发病率为应变量,进行空间线性回归运算,以进一步建立回归模型。运用ArcGIS 9.3软件进行最小二乘法运算,首次分析后得到各县(市)残差。对各县(市)残差进一步进行空间自相关分析,去除具有空间自相关性的县(市)发病率后,重新对其进行空间线性回归分析。建立的模型为:Y=-2.628*LON-4.253*LAT+514.019。但是LON(经度)的回归系数的检验结果t=2.165,P=0.123,说明该回归系数无统计学意义,而LAT(纬度)的回归系数检验t=-1.561,P=0.034,有统计学意义。因此可以看出,肺结核发病率随着纬度递增而递减,即由南向北递减的规律。
3 讨论GIS不仅可以直观、准确地显示疾病空间分布,了解疾病的空间聚集状态和高发区域,还可以进行疾病数据的探索性分析。此外,利用GIS可以对疾病的干预措施和效果进行评价,对疾病的发展趋势进行预测。随着GIS及其空间分析技术的不断成熟,其在传染病流行病学上的应用也越来越广泛〔8, 9, 10, 11〕。
本研究利用趋势面分析的优点在于:如果疾病受到局部因素影响导致总体发病趋势变得模糊不清时,趋势面分析可以排除局部的干扰,有助于显示出在大范围上的变化趋向。建立空间回归模型可以探索疾病的影响因素。针对研究结果,导致肺结核发病存在空间异质性的可能原因有:各地卡介苗接种率和肺结核发现率分布不均衡;各地的经济状况不同,苏南和苏北地区农村经济差距也十分显著;流动人口疾病监测和管理状况各地存在差异,随着经济的发展,流动人口日益增加,为疾病的传播和分布带来一定影响;居民的教育水平及接受宣教的情况等不同也会影响结核病的空间分布〔12, 13〕。
肺结核的发生和流行可能受很多因素的影响,生物性因素固然重要,但非生物因素也不容忽视,研究这些因素与不同区域疾病发生、分布和传播间的关系,可为流行病学的病因研究提供重要线索。而本研究不足的是尚未收集到完整准确的社会经济、地理环境因素等资料,故不能进一步探索肺结核发病的影响因素。因此需要根据结核病的地域分布规律,结合研究中"热点"区域,并将它们作为重点防治区,进一步探索导致"热点"区域产生的原因,有针对性地并且在源头上采取防控措施,从而达到降低肺结核发病率的目标。
| 〔1〕 | WHO.Global tuberculosis control:surveillance,planning,financing,In:Communicable diseases[J].Geneva:World Health Organization,2002. |
| 〔2〕 | Emma M.Drug-resistant tuberculosis on the rise[N].Nature News, 2008. |
| 〔3〕 | Gandhi NR,Shah NS,Andrews JR,et al.HIV coinfection in multidrug and extensively drug-resistant tuberculosis results in high early mortality[J].Am J Respir Crit Care Med,2010,18(1):80-86. |
| 〔4〕 | 张永强,刘泽军.地理信息系统(GIS)在公共卫生中的应用[J].中国公共卫生,2005,21(5):632-633. |
| 〔5〕 | Anselin L.How(not)to lie with spatial statistics[J].Am J Prev Med,2006,30(2):3-6. |
| 〔6〕 | 周晓农.空间流行病学[M].北京:科学出版社,2009:241-242. |
| 〔7〕 | 王海起,王劲峰,赵永军,等.GIS区域数据时空线性建模方式[J].中国石油大学学报:自然科学版,2008,32(5):159-164. |
| 〔8〕 | Springer YP,Samuel MC,Bolan G.Socioeconomic gradients in sexually transmitted diseases:a geographic information system-analysis of poverty,race/ethnicity,and gonorrhea rates in California,2004-2006[J].American Journal of Public Health,2010,100:1060-1067. |
| 〔9〕 | Alvarez-Hernandez G,Lara-Valencia F,Reyes-Castro PA,et al.An analysis of spatial and socio-economic determinants of tuberculosis in Hermosillo,Mexico,2000-2006[J].International Journal of Tuberculosis and Lung Disease,2010,14(6):708-713. |
| 〔10〕 | Shirayama Y,Phompida S,Shibuya K.Geographic information system(GIS)maps and malaria control monitoring:intervention coverage and health outcome in distal villages of Khammouane province, Laos[J].Malaria Journal,2009,8:217. |
| 〔11〕 | Bakker MI,Scheelbeek PF,Van Bees SM.The use of GIS in leprosy control[J].Leprosy Review,2009,80(3):327-331. |
| 〔12〕 | 杨晶,刘美娜,杨凤娟,等.应用两水平Logistic回归模型分析肺结核发病的影响因素[J].中国卫生统计,2009,26(4):374-376. |
| 〔13〕 | 孙德贵,石晓颖,李国浩,等.艾滋病与结核病的相关性研究[J]. 中华预防医学杂志,2009,43(2):176. |
2011, Vol. 27






