自回归滑动平均混合模型在辽宁省人间布鲁氏菌病发病预测中的应用
  疾病监测  2018, Vol. 33 Issue (3): 198-202

扩展功能

文章信息

王子江, 孙英伟, 毛玲玲, 于维君, 雷露, 孙广玖, 姚文清
Wang Zijiang, Sun Yingwei, Mao Lingling, Yu Weijun, Lei Lu, Sun Guangjiu, Yao Wenqing
自回归滑动平均混合模型在辽宁省人间布鲁氏菌病发病预测中的应用
Application of autoregressive integrated moving average model to predict human brucellosis incidence in Liaoning province
疾病监测, 2018, 33(3): 198-202
Disease Surveillance, 2018, 33(3): 198-202
10.3784/j.issn.1003-9961.2018.03.007

文章历史

收稿日期:2017-12-12
自回归滑动平均混合模型在辽宁省人间布鲁氏菌病发病预测中的应用
王子江1, 孙英伟1, 毛玲玲1, 于维君1, 雷露1, 孙广玖1, 姚文清2     
1. 辽宁省疾病预防控制中心感染与传染性疾病防制所, 辽宁 沈阳 110005;
2. 辽宁省疾病预防控制中心, 辽宁 沈阳 110005
摘要目的 了解辽宁省2006-2015年人间和家畜布鲁氏菌病(布病)疫情情况,建立时间序列模型,探索畜牧业因素对人间疫情影响,为布病预测防控提供依据。方法 收集辽宁省2006-2016年布病月发病数,以发病数建立时间序列构建自回归滑动平均混合(ARIMA)模型,对2016年1-6月进行短期预测,结合实际观测值评价预测效果;收集辽宁省同期羊存栏量和疫情,分析与人间发病存在的关联。结果 构建模型ARIMA(1,1,1)(1,1,1)12,月发病数拟合值与实际观测值时间序列基本一致,预测效果良好,但精确度较低。羊年存栏量与人间布病发病数存在正关联性。结论 ARIMA模型预测辽宁省布病发病情况基本可行,加强人畜布病的监测工作,以揭示人与家畜流行病学关系。
关键词人间布鲁氏菌病    ARIMA模型    预测    
Application of autoregressive integrated moving average model to predict human brucellosis incidence in Liaoning province
Wang Zijiang1, Sun Yingwei1, Mao Lingling1, Yu Weijun1, Lei Lu1, Sun Guangjiu1, Yao Wenqing2     
1. Department of Infectious Disease Control and Prevention, Liaoning Provincial Center for Disease Control and Prevention, Shenyang 110005, Liaoning, China;
2. Liaoning Provincial Center for Disease Control and Prevention, Shenyang 110005, Liaoning, China
This study was supported by the fund for National Science and Technology Major Project(No. 2017ZX10103007)
Corresponding author: Yao Wenqing, Email:yaowenqing@lncdc.com.
Abstract: Objective To establish an autoregressive integrated moving average (ARIMA) model to predict human brucellosis incidence in Liaoning, evaluate the influence of animal husbandry on human brucellosis and provide evidence for the prevention and control of human brucellosis. Methods The surveillance data of brucellosis from January 2006 to December 2016 in Liaoning were collected for the establishment of ARIMA model to predict and validate the brucellosis incidence from January to June 2016 in Liaoning. The sheep stock data at the end of a year from 2006 to 2016 were collected to analysis its relationship with human brucellosis. Results The ARIMA(1, 1, 1) (1, 1, 1)12 was established, and the predictive incidence was similar to the actual incidence, but this model showed a lower accuracy. There was a positive correlation between sheep stock at the end of the year and the outbreak of human brucellosis. Conclusion It was feasible to establish a ARIMA model for predicting brucellosis incidence in Liaoning. It is important to strengthen human brucellosis surveillance and find out the the epidemiological correlation between human and livestock.
Key words: Human brucellosis     Autoregressive integrated moving average model     Prediction    

布鲁氏菌病(布病)是由布鲁氏菌属所引起的传染-变态反应性人畜共患病。人间布病主要通过接触病畜或被病畜污染的食物、产品等致使人感染发病。辽宁省自2001年人间布病出现上升趋势,各县(区)均有新发病例报告,2001年发病率为0.32/10万,2015年上升至6.65/10万[1-2]。近年来时间序列模型被广泛应用到各类传染病预测研究[3-5],对布病疫情进行科学预测以及合理评价防控干预措施效果方面可能会有积极作用。本研究通过探索自回归滑动平均混合(ARIMA)模型在辽宁省布病发病预测中的应用,并对畜牧业因素与布病疫情的关联性进行初步探索。

1 材料与方法 1.1 疫情监测资料来源

人间布病监测资料来自辽宁省疾病预防控制中心全国法定传染病监测信息报告管理系统,收集2006-2016年辽宁省人间布病月发病数,人口资料及羊年末存栏量来自于辽宁省统计年鉴公布数据,家畜布病疫情资料来自农业部出版的《疫情公报》。

1.2 ARIMA模型构建与预测

ARIMA模型是Box-Jenkins方法中重要的时间序列分析预测模型,基本思想是将预测对象随时间的推移所形成的数据集视为一个随机序列,它是依赖于时间t的随机变量。试图解决的问题包括[6-7]:(1)分析时间序列的随机性、平稳性和季节性;(2)在对时间序列进行分析的基础上选择合适的模型进行预测。本研究通过SPSS 22.0软件构建模型,将2006年1月至2015年12月的月发病数据纳入模型构建,并对2016年前6个月的月发病数进行预测,进而与真实监测值进行比较来判断预测效果。

2 结果 2.1 模型识别

首先绘制月发病数的时间序列图,由图 1可见,我国布病发病报告数呈明显上升趋势,存在周期性和季节性规律,高峰出现在每年5-9月之间,周期为12个月,不平稳序列,对原始数据进行转换从而获得平稳序列。经过探索,对数据进行对数转换后,再进行一次差分和一次季节差分,即d= 1,D=1,布病的月发病数序列图趋于平稳,利用Eviews 8.0软件对序列进行ADF检验,得到P < 0.05,即序列消除了明显的增长趋势后,围绕一个常数上下波动。模型形式可以确定为ARIMA(p,1,q)(P,1,Q)12。对数转换及d=1,D=1差分后的ACF图见图 2。由图 2可以发现,从1阶后出现迅速衰减,视为拖尾,且偏相关回归图也是自1阶后迅速衰减,因此初步确定Q(q)为0或1,P(p)为0或1。

图 1 2006-2015年辽宁省人间布鲁氏菌病月发病报告数序列图 Figure 1 Monthly incidence of human brucellosis in Liaoning, 2006-2015
图 2 经过对数转换及d=1, D=1差分后的ACF图 Figure 2 ACF diagram after logarithmic transformation and d=1, D=1 difference
2.2 模型参数的估计和模型诊断

根据阶数从小到大依次组合测试,对模型进行拟合优度检验(残差序列检验),Ljung-Box Q值检验结果应为P>0.05,提示模型的残差序列为白噪声,可以进行模型预测。经过筛选,得到4种白噪声序列的模型,通过比较R2,确定最优模型为ARIMA(1,1,1)(1,1,1)12,4种模型比较见表 1。通过最优模型进行参数估计,见表 2。绘制模型的残差序列ACF和PACF图对模型进行诊断,本模型残差序列ACF和PACF图显示残差基本都落在95%区间内,P>0.05(图 3)。因此本模型可以用来预测辽宁省人间布病月发病报告数。

表 1 4种模型比较 Table 1 Comparison of four kinds of models
模型 R2 Ljung-Box Q检验显著性(P)
ARIMA(1, 1, 1)(1, 1, 1) 0.930 0.073
ARIMA(0, 1, 1)(1, 1, 1) 0.924 0.062
ARIMA(0, 1, 1)(0, 1, 1) 0.921 0.166
ARIMA(1, 1, 1)(0, 1, 1) 0.927 0.216
图 3 残差的自相关函数和偏自相关函数图 Figure 3 Residual diagram of ACF and PACF
2.3 预测应用

运用ARIMA(1,1,1)(1,1,1)12对辽宁省2006-2015年人间布病月发病报告数进行拟合预测(图 4),结果显示观测值和拟合值都在预测值的95% CI内,但绝对误差和相对误差整体较大,预测效果良好,但精确度不高。2016年观测值与拟合值比较结果见表 3,结果显示,观测值和拟合值的整体趋势基本一致,拟合值整体略高于观测值。

图 4 2006-2016年辽宁省人间布鲁氏菌病月发病数观测值与拟合值序列对比图 Figure 4 Comparison between observed value and predicted value of incidence of human brucellosis in Liaoning, 2006-2016
表 3 2016年1-6月辽宁省人间布鲁氏菌病月发病数观测值与拟合值比较 Table 3 Comparison between observed value and predicted value of incidence of human brucellosis in Liaoning, January-June, 2016
月份 观测值 拟合值 95%CI (下限) 95%CI (上限)
1 144 235 100 476
2 158 290 118 604
3 286 363 145 762
4 317 421 167 890
5 361 533 209 1 132
6 274 539 210 1 153
2.4 人间布病疫情与羊只年末存栏量、畜间疫情的关联性分析

辽宁省2006-2015年人间布病疫情年报告由457例持续增加到3 010例,发病率由1.08/ 10万增加到6.86/10万,且与全国的疫情形势基本一致(发病率由1.55/10万增加到4.34/10万)。辽宁省2006-2015年羊只年末存栏量由674万只增加到909万只,见图 5。与人间布病疫情关联性分析结果显示,秩相关系数为0.842(P < 0.05),可以认为羊只年末存栏量与布病年发病报告数之间存在正相关性。辽宁省家畜间布病疫情在2006年报告发病486只,2009年报告发病较多,当年报告布病家畜857只,捕杀857只,其后2012、2014和2015年无报告发病。

图 5 2006-2015年辽宁省羊只年末存栏量与人间布鲁氏菌病年发病数趋势 Figure 5 Sheep stock at the end of a year and incidence trend of human brucellosis in Liaoning, 2006-2015
3 讨论

本研究通过对2006-2015年辽宁省人间布病月发病数建立ARIMA模型,获得人间布病月发病数拟合值与实际观测值两条曲线基本吻合,由此对2016年1-6月的月发病数进行预测,所得的拟合值略高于实际观测值,预测精度下降。其原因可能为:一是来自于模型本身的局限性,尽管ARIMA模型在很大程度上能够提取时间序列信息,但是从原理上决定了其依旧是一个线性模型,而传染病时间序列数据往往是非线性甚至是随机的,此外影响发病的因素包括宿主因素、环境因素、社会干预等多方面,而目前无法收集到这些因素的月度信息资料[8-9];二是近年疾控部门与动物疫控部门执行《国家布鲁氏菌病防治计划(2016-2020年)》,加强联防联控,进行免疫家畜,起到了一定的防控效果。综上可能是对2016年的预测出现偏差的原因,但实际观测值并未超出拟合值95% CI范围,尚可以认为预测效果较好,对疫情预测仍具有一定意义。

全国人间布病发病近10年呈明显的上升趋势,并且不同地区的季节性差异比较明显[10]。在以往将ARIMA模型应用到人间布病研究的文献中,白永飞等[11]对山西省布病监测资料创建ARIMA(1,0,1)(1,1,0)12模型,娄鹏威等[12]对新疆布病监测资料创建ARIMA(0,1,2)(1,1,0)12模型,均取得了较好的预测效果,二者与本研究所采纳的模型不同,提示不同地区不同监测资料背景下需要根据不同的资料序列特征来进行趋势调整和季节调整,进一步建立适合于当前序列的模型来进行预测应用。此外,有文献显示具有周期性的数据在应用时间序列模型时需要足够的序列期数,同时短期预精度较高,不适用于长期预测[13]

从流行病学分析,布病作为人畜共患病,人感染布病的传染源是家畜,与家畜疫情及相关畜牧业因素应存在必然关联。由于辽宁省人间布病多为羊种布鲁氏菌引起[14],随着羊只存栏量的增多,人间疫情也会加重,从某个角度看符合流行病学的规律。但是,近年从农业部国家的家畜布病疫情信息系统,看到与人间的疫情明显差异,提示布病的控制需要加强与畜间疫情的联防联控的空间,疾控系统需要认真报告、核实人间病例的同时,加强漏报率管理。动物疫情控制机构也应加强家畜布病的监测,科学地反映家畜疫情信息,进一步强化检疫工作,及时处置淘汰病畜,以揭示辽宁省家畜与人间疫情真实流行病学关系,有效控制传染源,防止人、畜间疫情的传播扩散。

作者贡献:

王子江  ORCID:0000-0001-5548-520X

王子江:负责文章撰写与模型的建立

孙英伟、毛玲玲:主要负责布病的实验室检测工作

于维君:负责人间疫情数据的收集

雷露:负责协助完成布病实验室检测

孙广玖:负责布病疫情的调查

姚文清:负责文章的修改工作

参考文献
[1]
孙英伟, 毛玲玲, 李鑫, 等. 辽宁省2001-2011年布鲁氏菌病流行特征分析[J]. 中国媒介生物学及控制杂志, 2012, 23(3): 268-269.
Sun YW, Mao LL, Li X, et al. Epidemiological analysis of human brucellosis in Liaoning province from 2001 to 2011[J]. Chin J Vector Biol Control, 2012, 23(3): 268-269.
[2]
孙英伟, 毛玲玲, 孙广玖, 等. 2012-2015年辽宁省布鲁氏菌病疫情监测结果分析[J]. 疾病监测, 2017, 32(3): 200-202.
Sun YW, Mao LL, Sun GJ, et al. Surveillance for brucellosis in Liaoning province, 2012-2015[J]. Dis Surveill, 2017, 32(3): 200-202. DOI:10.3784/j.issn.1003-9961.2017.03.008
[3]
张越, 王胜难, 刘媛, 等. 应用ARIMA模型对呼吸系统疾病月住院量及住院费用的预测[J]. 中国卫生统计, 2015, 32(2): 197-200.
Zhang Y, Wang SN, Liu Y, et al. Application of ARIMA model on predicting monthly hospital admissions and hospitalization expenses for respiratory diseases[J]. Chin J Health Statistics, 2015, 32(2): 197-200.
[4]
王永斌, 李向文, 柴峰, 等. ARIMA模型在我国梅毒发病率预测中的应用[J]. 现代预防医学, 2015, 42(3): 385-388, 417.
Wang YB, Li XW, Chai F, et al. Application of ARIMA model in prediction of incidence of syphilis in China[J]. Mod Prev Med, 2015, 42(3): 385-388, 417.
[5]
Delory T, de Pontfarcy A, Emirian A, et al. Impact of a program combining pre-authorization requirement and post-prescription review of carbapenems:an interrupted time-series analysis[J]. Eur J Clin Microbiol Infect Dis, 2013, 32(12): 1599-1604. DOI:10.1007/s10096-013-1918-5
[6]
Box GEP, Jenkins GM, Reinsel GC. 时间序列分析: 预测与控制[M]//顾岚, 译. 3版. 北京: 中国统计出版社, 1997: 211-236, 377-403.
Box GEP, Jenkins GM, Reinsel GC. Time series analysis: forecasting and control[M]//Gu L. 3rd ed. Beijing: China Statistics Press, 1997: 211-236, 377-403.
[7]
Reis BY, Mandl KD. Time series modeling for syndromic surveillance[J]. BMC Med Inform Decis Mak, 2003, 3: 2. DOI:10.1186/1472-6947-3-2
[8]
Olsen SC, Palmer MV. Advancement of knowledge of Brucella over the past 50 years[J]. Vet Pathol, 2014, 51(6): 1076-1089. DOI:10.1177/0300985814540545
[9]
朱琦, 于石成, 郝元涛. 传染病监测数据的统计分析方法[J]. 中国卫生统计, 2011, 28(2): 217-220.
Zhu Q, Yu SC, Hao YT. Statistical analysis method for monitoring data of infectious diseases[J]. Chin J Health Stat, 2011, 28(2): 217-220. DOI:10.3969/j.issn.1002-3674.2011.02.039
[10]
田德红, 于国伟, 丁国武, 等. ARIMA-DES混合模型在中国布鲁菌病分析和预测中的应用[J]. 中国卫生统计, 2016, 33(2): 245-248.
Tian DH, Yu GW, Ding GW, et al. The application of ARIMA-DES mixed model in the analysis and prediction of brucellosis in China[J]. Chin J Health Stat, 2016, 33(2): 245-248.
[11]
白永飞, 徐丽红, 郭支喜, 等. 山西省布鲁氏菌病时间序列自回归移动平均模型分析[J]. 疾病监测, 2011, 26(8): 647-650.
Bai YF, Xu LH, Guo ZX, et al. Time series Autoregressive Integrated Moving Average model to predict brucellosis incidence in Shanxi province[J]. Dis Surveill, 2011, 26(8): 647-650. DOI:10.3784/j.issn.1003-9961.2011.08.019
[12]
娄鹏威, 吴秀峰, 张学良, 等. 基于ARIMA乘积季节模型的新疆布鲁氏菌病流行趋势分析[J]. 新疆医科大学学报, 2017, 40(1): 86-90.
Lou PW, Wu XF, Zhang XL, et al. The epidemic analysis of brucellosis in Xinjiang base on the multiple seasonal ARIMA model[J]. J Xinjiang Med Univ, 2017, 40(1): 86-90. DOI:10.3969/j.issn.1009-5551.2017.01.022
[13]
王怡, 张震, 范俊杰, 等. ARIMA模型在传染病预测中的应用[J]. 中国预防医学杂志, 2015, 16(6): 424-428.
Wang Y, Zhang Z, Fan JJ, et al. Application of ARIMA model in the forecasting of infectious disease[J]. Chin Prev Med, 2015, 16(6): 424-428.
[14]
毛玲玲, 姜海, 雷露, 等. 辽宁省2010年布鲁氏菌病疫情及MLVA分型[J]. 中国公共卫生, 2012, 28(12): 1650-1652.
Mao LL, Jiang H, Lei L, et al. Brucellosis epidemic and MLVA typing in Liaoning province in 2010[J]. Chin J Public Health, 2012, 28(12): 1650-1652. DOI:10.11847/zgggws-2012-28-12-37