中国公共卫生  2011, Vol. 27 Issue (2): 237-238   PDF    
ARIMA模型在中国5岁以下儿童死亡率预测中应用
刘洁, 曲波, 郭海强, 孙高     
中国医科大学公共卫生学院卫生统计教研室
关键词: 求和自回归滑动平均模型法(ARIMA)     5岁以下儿童死亡率     预测    

5 岁以下儿童死亡率 ( child mortality rate under age 5 ,U5MR )是评价国家或地区卫生服务水平和经济发展状况的重要指标之一 1。 U5MR受诸多因素影响,且各因素间有着错综复杂的联系,很难运用结构式的因果模型加以解释,而数据间的相互依存关系是研究对象最重要的特性,因此,了解该特性对预测 U5MR 并提出相应预防措施有重要意义。 本研究应用求和自回归滑动平均模型法 ( auto aggressive inte-grated moving average,ARIMA )对 U5MR 进行拟合和预测,旨在探讨运用该模型预测 U5MR 的可行性。

1 资料与方法 1.1 资料来源

资料来源于中华人民共和国卫生部卫生信息中心《2009中国卫生统计年鉴》 2和 《2010中国卫生统计提要》3中 1991- 2009年中国城乡 U5MR数据。

1.2 方法 1.2.1 ARIMA模型基本原理

将预测对象随时间推移而变化的数据序列作为一个随机序列,以时间 t综合代替各种影响因素,建立时序模型,以达到预测未来的目的,过程简便,短期预测精度较高。 统计学上 ARIMA ( p,d,q ) 模型记作: φ ( B ) ( 1- B ) dXt = C + θ( B )at

其中,t代表时间,Xt 表示时间序列,B 是后移算子,p,d,q 分别表示自回归阶数、差分阶数和移动平均阶数;φ( B ) = 1- φ 1B2B2 - φnBn,θ( B )表示自回归算子; θ( B ) = 1 -θ1B2B2nBn,θ( B )表示滑动平均算子。 at 代表随机扰动,即随机误差项,C 表示常数项。

1.2.2 ARIMA模型建立4

ARIMA模型建立过程包括原始资料趋势分析、序列的平稳化、模型的识别、定阶与参数估计和模型的检验及预测分析。 原始资料的变化趋势可分为平稳的时间序列和非平稳的时间序列,通过时间序列图、自相关函数 ( auto correlation function,ACF ) 及偏自相关函数 ( partial auto correlation function ,PACF )判断序列的平稳性。 如果为非平稳数列,需要通过差分,数据变换等方法将不平稳的时间序列转化为平稳序列。 对平稳时间序列,采用 Box-Jenkins模型识别方法,建立模型。 所建 ARIMA 模型是否合理需检验残差序列是否为白噪声。 如果残差序列不是白噪声序列,则需要重新建立模型,重复上述过程,直到残差序列是白噪声序列为止。 用选定的模型对将来某个时期的数值及可信区间做出预测。

1.3 统计分析

应用 SPSS 13.0软件进行数据预测分析,包括点值估计和区间估计 ( 95% CI )。

2 结果 2.1 1991-2009 年中国 U5MR 拟合及预测情况 (表1 )

ARIMA模型预测结果表明,1991-2009 年中国 U 5M R的实际值和预测值基本相符,到 2010年 U5MR 将下降至 14.88 ‰,与 2000年的 39.70 ‰比较,U5M R将下降 62.52 % 。 应用残差序列的自相关函数图来检验残差序列是否为白噪声,结果显示,自相关函数表现为随机分布,该 ARIMA模型合理。

表 1 中国 U5M R拟合及预测结果 (‰)
2.2 1991-2009 年城市 U5MR 拟合及预测情况 (表2 )

ARIMA模型预测结果表明,1991- 2009 年中国城市 U 5MR 的实际值和预测值基本相符,到 2010年城市的 U5MR将下降至 5.44 ‰,与 2000 年的 13.80 ‰比较,城市 U5MR 将下降 60.58% 。 自相关函数表现为随机分布,该 ARIMA模型合理。

表 2 城市 U5MR 拟合及预测结果 (‰)
2.3 1991- 2009 年农村 U5MR 拟合及预测情况 (表3 )

ARIMA 模型预测结果表明,1991- 2009年中国农村 U5MR 在 2010年将下降到 21.59 ‰,与 2000 年的 45.70 ‰比较,农村 U5MR 将下降 52.76% 。 自相关函数表现为随机 分布,该ARIMA 模型合理。

表 3 农村 U5MR 拟合及预测结果 (‰)
3 讨论

中国幅员辽阔、民族众多、地区间经济和社会发展水平不平衡,U5MR水平受经济、社会、文化、教育、卫生和人口等多种因素的影响和制约,各种因素关系错综复杂。 ARIMA模型依据随时间变化且相互关联的动态数据,以时间 t综合代替各种影响因素建立时序模型,在预测过程中充分考虑了不同时期的原始数据和既往预测误差对将来值影响的方向及大小,其预测精度较高5, 6, 7, 8。 本研究利用 ARIMA 模型对 2010 年全国、城市和农村的 U5MR 进行预测,结果表明,该模型的拟合和预测效果较好。 2000 年联合国《千年宣言》和 2002 年联合国儿童问题特别会议制定的《适合儿童生长的世界》文件提出了到 2010 年 U5MR 在 2000 年的基础上下降 1 /39,即 2010 年中国 U5MR 将下降到 26.47‰ 。 本研究预测结果表明,中国到 2010年全国、城市和农村的 U 5MR 将分别下降到 14.88‰,5.44‰和 15.44‰,均低于联合国“全球目标”的 26.47‰,呈较大幅度下降趋势。

参考文献
〔1〕 李嘉.辽宁省 2000-2004 年5岁以下儿童死亡率分析 [J].中国公共卫生,2007,23(1):103.
〔2〕 卫生部.2009 年中国卫生统计年鉴.[EB/OL].[2009-8-26].http://www.moh.gov.cn/publicfiles/business/htmlfiles/zwgkzt/ptjnj/200908/42635.hmt.
〔3〕 卫生部.2010 年中国卫生统计提要 [EB/OL].[2010-5-13].http://www.moh.gov.cn/publicfiles//business/htmlfiles/zwgkzt/ptjty/digest2010/index.hmtl.
〔4〕 王振龙.时间序列分析 [M].北京:中国统计出版社,2002:181-192.
〔5〕 冯超,白杉.时间序列模型拟合艾滋病发病趋势预测 [J].中国公共卫生,2005,21(7):893.
〔6〕 金如锋,邱宏,周霞,等.AR IMA 模型和 GM (1,1) 模型预测全国3种肠道传染病发病率 [J].复旦大学学报:医学版,2008,35(5):675-680.
〔7〕 张文增,冀国强,史继新,等.ARIMA 模型在细菌性痢疾预测预警中的应用 [J].中国卫生统计,2009,12(6):636-639.
〔8〕 漆莉,李革,李勤,等.ARMIA模型在流行性感冒预测中的应用[J].第三军医大学学报,2007,29 (3):267-269.
〔9〕 联合国.适合儿童生长的世界 〔EB/OL〕.[2002-5-10].http://www.un.org/chinese/children/issue/aworldfit forchildren.shtml.