中国公共卫生  2017, Vol. 33 Issue (10): 1482-1484   PDF    
辽宁省手足口病疫情季节性ARIMA模型预测效果评价
高雅1, 王伶2, 吴伟3, 于伟2, 张倩2, 宗莉1, 赵卓2    
1. 辽宁省疾病预防控制中心感染与传染性疾病控制所,沈阳 110005;
2. 大连医科大学公共卫生学院;
3. 中国医科大学公共卫生学院
摘要目的 利用时间序列法研究手足口病的发病趋势和流行特征,建立ARIMA乘积季节模型,对2017年7月—2018年12月辽宁省手足口病的月发病疫情情况及流行强度进行预测,为手足口病的预防监测工作提供依据。方法 收集辽宁省手足口病2012年1月—2016年12月的月发病报告数,采用Excel 2010建立辽宁省手足口病月报告发病数数据库,应用SPSS 23.0软件进行SARIMA模型的构建,拟合发病情况,对辽宁省手足口病2017年7月—2018年12月发病数进行预测,评价预测效果。结果 辽宁省手足口病发病特征以年为流行周期,季节性周期为12个月(s=12)。每年6—9月为该病的发病高峰期。最佳模型为SARIMA(0,1,0)×(1,1,0)12季节性模型,模型残差Ljung-Box Q=18.564,P=0.354,序列为白噪声。预测平均相对误差为0.229,预测效果较好。结论 季节性ARIMA模型能较好的拟合辽宁省手足口病的发病流行趋势,能够比较直观准确的反映辽宁省手足口病的疫情发展情况,该模型适用于辽宁省手足口病的短期流行趋势的预测。
关键词手足口病     季节性ARIMA模型     辽宁省     预测    
Prediction of hand-foot-mouth disease epidemic with seasonal autoregressive integrated moving average model
GAO Ya, WANG Ling, WU Wei, et al     
School of Public Health, Dalian Medical University, Dalian, Liaoning Pro-vince 116044, China
Abstract: Objective To describe the prevalence and incidence trend of hand-foot-mouth disease (HFMD) using time series method and to establish a seasonal autoregressive integrated moving average (SARIMA) model for the prediction of HFMD epidemic from July 2017 to December 2018 in Liaoning province. Methods A prediction model was set up based on reported monthly data of HFMD from January 2012 through 2016 in Liaoning province using Excel and SPSS 23.0 software.Then the model was used to predict monthly incidents of HFMD from July 2017 to December 2018 and the prediction efficiency was evaluated. Results Yearly cycle and 12-month seasonal period of HFMD epidemic were observed.There was an incidence peak for HFMD epidemic from June to September during a year in Liaoning pro-vince.The established optimum model was SARIMA(0, 1, 0)×(1, 1, 0)12.The Ljung-Box Q statistics is 18.564(P=0.354).The noise of residual series of the ARIMA model was white noise and the mean error was 0.229. Conclusion The established seasonal ARIMA model could well fit the monthly data of HFMD epidemic in Liaoning province and the model could be applied to predict short-term incident trend of HFMD in the province.
Key words: hand-foot-mouth disease     seasonal ARIMA     model     prediction    

手足口病(hand-foot-mouth disease, HFMD)是由多种人肠道病毒引起的一种儿童常见传染病,于2008年定为中国法定报告管理的丙类传染病[1]。大多数患儿患病症状轻微,以发热和手足、臀部以及口腔颊面等部位出现皮疹或疱疹为主要症状[2]。少数患儿可引起肺水肿、心肌炎、无菌性脑膜炎等一系列并发症,严重时可导致患儿死亡[3]。近些年来有研究显示,手足口病的发病具有周期性以及长期性的变化趋势,并且存在随机干扰的情况[4-5]。既往研究表明,利用SARIMA模型(seasonal autoregressive integrated moving average model, 季节求和自回归移动平均模型)对手足口病的发病数进行预测是中国目前较为常用的预测方法之一[6-9]。有学者认为,要想得到较为准确和较为满意的预测效果,ARIMA模型的建立需基于足够多的时间序列数据,通常应用至少30个以上长度的时间序列数据来进行模型的构建[10-12]。因此本研究选择辽宁省2012年1月—2016年12月的月报告发病数共计60个数据为基础,建立SARIMA模型,对辽宁省2017年7月—2018年12月发病数进行预测。探讨并验证该模型在手足口病预测方面的可行性及准确性,为今后手足口病的防控监测工作提供科学依据。

1 资料与方法 1.1 资料来源

辽宁省手足口病月发病数的数据资料均来源于《中国疾病预防控制信息系统》中的传染病报告信息管理系统,本研究选取2012年1月—2016年12月手足口病的月报告发病数来进行分析和建模。

1.2 方法

求和自回归移动平均(autoregressive integrated moving average, ARIMA)模型,是20世纪70年代提出的一种时间序列预测方法。针对数据存在的季节性或周期性波动趋势,可以通过季节求和自回归移动平均(SARIMA)模型研究季节性或周期性对时间序列的影响。建模的基本步骤:(1)序列的平稳性检验。判断原序列是否平稳,对于非平稳的序列需通过对数转换、差分、季节差分等方式对数据进行平稳化处理,以消除季节性或趋势带来的影响。(2)模型的识别和参数估计。通过差分及季节性差分来确定模型d和D的阶值,根据ACF(autocorrelation function, 自相关函数)和PACF(partial autocorrelation function, 偏自相关函数)图形,初步判断模型中p, q和P, Q的阶值[13]。p, q为自回归和移动平均阶数,d为差分次数,P,Q为季节性自回归和移动平均阶数,D为季节性差分次数,S为季节周期和循环长度。求和自回归移动平均模型通用表达式为:ARIMA=(p, d, q)×(P, D, Q)S。(3)模型预测和应用。选取辽宁省2012年1月—2016年12月的手足口病月报告发病数建立数据模型,计算相对误差,预测辽宁省2017年7月—2018年12月手足口病的月发病数,评价其预测的效果。

1.3 统计分析

应用Excel 2010软件建立辽宁省手足口病的月报告发病数数据库,应用SPSS 23.0软件进行SARIMA模型的构建及分析、预测。

2 结果 2.1 序列的平稳性检验

对辽宁省手足口病2012年1月—2016年12月的各月发病数数据做时间序列图及ACF和PACF图可知该序列是非平稳序列,且存在明显的季节性趋势特征,季节性周期12个月(即s=12)。接下来对该序列进行自然对数转换、1阶差分以及1阶季节性差分获得新序列。处理后的数据序列图在0上下均匀波动,结合对比ACF和PACF的结果可知,处理后的新序列消除了季节性及周期性的波动,符合建模数据平稳性的要求。

2.2 模型的识别、参数估计及模型检验(表 1)
表 1 模型比较

由于数据进行1阶差分和1阶季节差分后呈平稳性,则可确定该模型中d=D=1。依据相关文献可知通常P、Q的取值超过2的情况较为少见[14],则P、Q取值在0、1、2之间进行讨论。根据新序列ACF和PACF图拖尾情况确定p,q取值,结合拟合精度指标及模型参数统计学意义的准则,初步建立SARIMA(0, 1, 0)×(1, 1, 0)12模型和SARIMA(2, 1, 2)×(1, 1, 0)12模型。对两模型进行比较(表 1),SARIMA(0, 1, 0)×(1, 1, 0)12模型BIC值小于SARIMA(2, 1, 2)×(1, 1, 0)12,且R2大于后者,可认定模型SARIMA(0, 1, 0)×(1, 1, 0)12为较优模型。对SARIMA(0, 1, 0)×(1, 1, 0)12模型的残差进行自相关检验及白噪声检验,残差ACF图和PACF图可知自相关函数的Ljung-Box Q=18.564,P=0.354,大于检验水平0.05,可认为该残差序列不存在自相关关系,且该模型的参数检验有统计学意义。

2.3 模型的拟合效果评价(表 2)
表 2 2016年辽宁省手足口病月发病数ARIMA模型拟合效果评价

应用SARIMA(0, 1, 0)×(1, 1, 0)12模型对辽宁省2012年1月—2016年12月手足口病的月发病数进行拟合分析,拟合后动态趋势与观测值的基本一致,表明该模型能较好的拟合该病的流行波动趋势,证明该模型可用于辽宁省手足口病的短期流行趋势的预测。应用2016年手足口病的实际月发病报告数对该模型的拟合结果进行评价,模型的观测值和预测值发病趋势基本一致,数值均落在95%可信区间内。平均相对误差为0.229,拟合效果良好。

2.4 模型的预测与应用(表 3)
表 3 辽宁省手足口病月报告发病数预测值

应用SARIMA(0, 1, 0)×(1, 1, 0)12模型对辽宁省2017年7月—2018年12月手足口病的月发病数进行拟合预测,预测值及95%可信区间见表 3

3 讨论

目前,用于预测疾病流行趋势的方法有很多种,近些年来ARIMA模型已经被越来越多的应用于多种传染病的预测和分析上[15-17]。基于手足口病的发病及流行特点,针对其明显的季节性和周期性的波动特征,可应用SARIMA模型来研究季节性或周期性对时间序列的影响。该模型对传染病的发生及流行情况能够进行较为准确的分析和预测,在公共卫生领域对指导传染病的预防控制工作具有非常高的实际应用价值。本研究中SARIMA(0, 1, 0)×(1, 1, 0)12模型能较好的拟合辽宁省的流行趋势,能较直观准确反映全省手足口病的疫情发展情况。预测结果显示,6—9月为辽宁省手足口病发病高峰,与既往发病高峰期一致。提示,在该时间段辽宁省应重点加强手足口病的防控工作,加强卫生督导,及时与教育、医疗保健机构开展联控联防工作,以减少发生聚集性暴发疫情[18]

还需注意的是,手足口病的预测是基于理想情况下的模型预测,但实际工作中,易感人群个体差异、病毒基因型变异、气候影响、个体生活习惯差异、卫生督导力度等因素,均会影响手足口病的流行和传播[19]。从2016年拟合结果中可看出,12月份预测相对误差0.005,而2月份则为1.806,可见ARIMA模型的预测并非百分百准确无误,上述干扰情况可能会影响预测准确性,这在今后的研究中还需要特殊注意。

传染病的流行趋势预测,是制定传染病短期和长期应对措施和策略的重要前提,同时也是变被动治疗为主动预防的关键环节[20]。科学严谨的预测,应是建立在大量的监测信息基础上的,运用科学有效的分析方法,从大量的监测数据中寻找传染病流行的规律,这对今后传染病的科学防治和重点疾病的防控工作均有着重要的应用价值。

参考文献
[1] The Ministry of Health of the People's Republic of China.Guideline of hand foot and mouth disease prevention and control[S].Beijing:The Ministry of Health of the People's Republic of China, 2014.
[2] Vcntarola D, Bordonc L, Silverberg N. Update on hand-foot-and-mouth disease[J]. Clin Dermatol, 2015, 33(3): 340–346. DOI:10.1016/j.clindermatol.2014.12.011
[3] Wang ZL, Xia AM, Li YF, et al. Socioeconomic burden of hand, foot and mouth disease in children in Shanghai, China[J]. Epidemiol Infect, 2016, 144(1): 138–143. DOI:10.1017/S0950268815001569
[4] 王永斌, 柴峰, 李向文, 等. ARIMA模型与残差自回归模型在手足口病发病预测中的应用[J]. 中华疾病控制杂志, 2016(3): 303–306.
[5] 陈银苹, 吴爱萍, 余亮科. 组合模型对乙肝发病趋势的预测研究[J]. 解放军医学杂志, 2014(1): 52–56. DOI:10.11855/j.issn.0577-7402.2014.01.12
[6] 潘浩, 胡家瑜, 吴寰宇, 等. GM(1, 1)灰色模型和ARIMA模型在上海市手足口病发病率预测应用中的比较研究[J]. 中华疾病控制杂志, 2011(5): 445–448.
[7] Earnest A, Chen MI, Ng D, et al. Using autoregressive integrated moving average(AR IMA)models to predict and monitor the number of beds occupied during a SARS outbreak in a tertiary hospital in Singapore[J]. BMC Health Serv Res, 2005, 5(1): 36. DOI:10.1186/1472-6963-5-36
[8] Quénel P, Dab W. Influenza A and B epidemic criteria based on time series analysis of health services surveillance data[J]. Eur J Epidemiol, 1998, 14(3): 275–285. DOI:10.1023/A:1007467814485
[9] Liu Q, Liu X, Jiang B, et al. Forecasting incidence of hemorrhagic fever with renal syndrome in China using ARIMA model[J]. BMC lnfect Dis, 2011, 11(1): 218. DOI:10.1186/1471-2334-11-218
[10] 陈纯, 肖新才. 季节性ARIMA模型在广州市手足口病疫情预测中的应用[J]. 中国预防医学杂志, 2016(2): 90–94.
[11] 李标, 李雪梅, 古丽斯. ARIMA模型在手足口病预测预警中的应用[J]. 中国卫生产业, 2014(23): 26–27.
[12] 陆波, 闵思韬, 闵红星, 等. 应用ARIMA模型预测麻疹发病率的可行性研究[J]. 中国卫生统计, 2015(1): 106–107.
[13] Zhang X, Zhang T, Young AA, et al. Applications and comparisons of four time series models in epidemiological surveillance data[J]. PLoS One, 2014, 9(2): e88075. DOI:10.1371/journal.pone.0088075
[14] 孙佰红, 安庆玉, 田疆, 等. 单一ARIMA模型和联合模型比较预测辽宁省感染性腹泻疫情[J]. 职业与健康, 2016(1): 76–79.
[15] 郑庆鸣, 王铁强, 刘义, 等. ARIMA模型在预测2013年深圳市光明新区手足口病发病趋势中的应用[J]. 职业与健康, 2014(9): 1198–1201, 1205.
[16] 安淑一, 赵卓, 郭军巧, 等. 应用时间序列模型预测辽宁省麻疹疫情[J]. 中国卫生统计, 2014(5): 781–783.
[17] 朋文佳, 朱玉, 何倩, 等. ARIMA乘积季节模型在细菌性痢疾月发病率预测中的应用[J]. 中国卫生统计, 2011(6): 645–647.
[18] 袁国平, 郭祖鹏, 杨兴堂, 等. 手足口病发病影响因素病例对照研究[J]. 中国公共卫生, 2011, 27(11): 1407–1409. DOI:10.11847/zgggws2011-27-11-18
[19] 郭泽强. 传染病预测方法的研究[J]. 职业与健康, 2012(5): 610–612.
[20] Bo YC, Song C, Wang JF, et al. Using an autologistic regression model to identify spatial risk factors and spatial risk patterns of hand, foot and mouth disease(HFMD)in Mainland China[J]. BMC Public Health, 2014, 14(1): 358. DOI:10.1186/1471-2458-14-358