中国公共卫生  2014, Vol. 30 Issue (9): 1234-1235   PDF    
细菌性痢疾月发病率ARIMA季节模型预测分析
石雷    
辽阳市疾病预防控制中心, 辽宁 111000
关键词自回归移动平均模型(ARIMA)     细菌性痢疾     预测    

传染病发病预测是传染病防控中的难点问题,也是疾病预防控制机构重要职责,本研究利用自回归移动平均模型(Autoregressive integrated moving average,ARIMA)模型对辽宁省辽阳市细菌性痢疾的发病进行时间序列分析,并预测2012年的月发病率,并与实际发病率相对照,为早期发现和控制细菌性痢疾流行及采取有效预防控制措施提供科学依据。
资料与方法

(1)资料来源:中国疾病预防控制信息系统报告的2005—2012年辽阳市细菌性痢疾月发病率。(2)方法:对辽阳市2005—2011年细菌性痢疾的月发病率资料建立ARIMA季节模型,并进行预测分析。(3)统计分析:应用ARIMA对细菌性痢疾的发病趋势进行预测。利用SPSS 17.0软件进行建模。
结 果

(1)绘制时间序列图:根据2005—2011年辽阳市细菌性痢疾的月发病率绘制时间序列图,结果显示细菌性痢疾的月发病率存在明显的季节信息,初步判断为非平稳序列,故需要对数据做一阶季节差分,采用ARIMA(p,d,q)(sp,sd,sq)12模型。(2)模型拟合:绘制细菌性痢疾月发病率一阶季节差分后的序列图、自相关函数图(autocorrelation function,ACF)、偏相关函数图(partial correlation function,PACF),可见一阶季节差分后的序列平稳,ACF拖尾和PACF截尾,故模型可能是ARIMA(1,0,0)(1,1,0)12、ARIMA(0,0,1)(1,1,0)12等,分别对模型进行拟合,根据可决定系数和标准化BIC值进行判断,可决定系数越高,BIC值越小的模型拟合效果最好,通过对各模型结果的比较,ARIMA(1,0,0)(1,1,0)12模型的可决定系数为0.747,在各模型中最高,BIC值为-0.69,在各模型中最小,故选用ARIMA(0,0,1)(1,1,0)12模型对数据进行拟合。(3)模型检验(表 1):估计ARIMA(1,0,0)(1,1,0)12模型参数,并对一阶季节差分的残差序列进行白噪声检验,残差自相关检验结果从表中可见,在任何时滞上的P值均>0.05,自相关系数差异均无统计学意义,可认为残差序列为白噪声序列,且该模型对细菌性痢疾月发病率序列蕴含的信息提取完全。(4)模型预测(表 2) 利用ARIMA(1,0,0)(1,1,0)12模型对辽阳市2006—2011年细菌性痢疾月发病率进行拟合,2012年各月实际值与预测值不完全相同,个别预测值偏离真实值,大多数预测值与真实值吻合较好。预测图显示各年月发病率呈明显的季节性,且呈逐年递减的趋势,2006—2011年的实际值与预测值趋势基本吻合,实际值均在预测值的可信区间范围内,表明该模型拟合较好,同时提示2012—2013年细菌性痢疾的月发病率水平基本平稳,与2011年相近,不会出现较大的流行。

表 1 ARIMA(1,0,0)(1,1,0)12模型残差检验白噪声检验结果
表 2 2012年辽阳细菌性痢疾月发病拟合结果

讨 论

利用数理模型对传染病发病进行预测是传染病预测预警的一个主要探索方向,目前用于疾病预测的模型主要包括回归分析预测模型和时间序列预测模型两类[1]。ARIMA模型由Box和Jenkins于20世纪70年代提出,也称作B-J时间序列分析模型[2]。ARIMA模型具有应用范围广泛、模型简单、预测精度较高等优点,适合于对流行因素较稳定的疾病进行预测,特别是具有季节性趋势的传染病的预测。当前,已有一些学者[3-5]成功地运用 ARIMA 模型对传染病的发病趋势进行了预测,并取得了较为理想的拟合结果。本研究对2012年辽阳市的月发病率行了预测,并与实际值进行了比较,月发病率预测值与实际值不完全相同,但实际值均落入预测值的可信限内,表明当月疫情基本正常。需要注意在使用ARIMA模型进行预测时,就根据所要解决的问题特点来综合考虑,选择相对较优的模型,同时一定要注意ARIMA模型是一类精度较高的时间序列短期预测模型,随着预测期延长,预测误差也会相应增大[6]。应尽可能多的收集时间序列数据,对已建立的模型用新的实际值进行验证,并不断加入新的实际值以修正预测模型。只有对细菌性痢疾进行长期的动态监测,才能准确掌握其发病的变化趋势。

参考文献
[1] 梁会营,李雪莲,郭军巧,等.3 种模型在肾综合症出血热发病率拟合预测中的比较研究[J].中国医科大学学报,2008,37(6):843-846.
[2] 方积乾,陆盈.现代医学统计[M].北京:人民卫生出版社,2002:233.
[3] 吴秀华,王福兴.风疹疫情时间序列模型预测效果评价[J].中国公共卫生,2010,26(11):1375.
[4] 向伦辉,袁国平,茅俭英.上海市宝山区细菌性痢疾发病率的ARIMA模型研究[J].中华疾病控制杂志,2011,15(11):990-992.
[5] 杨召,叶中辉,尤爱国.乘积季节ARIMA模型在结核病发病率预测中应用[J].中国公共卫生,2013,29(4):469-472.
[6] 石美娟.模型在上海市全社会固定投资预测中的应用[J].统计与信息论坛,2003(6):84-87.