中国公共卫生  2015, Vol. 31 Issue (4): 390-393   PDF    
丙肝疫情3种不同疾病预测预警方法比较
姜超1, 刘文东2, 胡建利2, 朱叶飞2, 鲍昌俊2, 汤奋扬2, 彭志行1, 陈峰1     
1. 南京医科大学公共卫生学院流行病与卫生统计学系, 江苏 南京 211166;
2. 江苏省疾病预防控制中心
摘要目的 分析Markov链模型、Holt-Winters指数平滑模型、控制图预警模型3种预测预警方法对江苏省丙型肝炎(丙肝)疫情的预测效果,为丙肝的预防控制提供科学依据.方法 收集江苏省传染病疫情管理系统1997—2009年法定报告传染病疫情中丙肝的发病资料,分别建立Markov链模型、Holt-Winters指数平滑模型以及控制图预警模型,比较3种方法对丙肝预测的效果.结果 Markov链模型预测江苏省2009年9—12月丙肝的发病数均>120例,与实际发病例数的164、125、145、138例相符;Holt-Winters季节迭加模型(α=0.46,β=0.001,γ=0.001)预测效果较好,RMSE和MAPE分别为12.629 85和19.18%;控制图5年预警模型可以用于丙肝疫情的预警,将P70作为预警界值,灵敏度、特异度均 >90%.结论 Markov链模型、Holt-Winters指数平滑模型是丙肝预测的良好方法,控制图预警模型可用于丙肝疫情的预警.
关键词预测     丙型肝炎(丙肝)     Markov链模型     Holt-Winters指数平滑模型     控制预警模型    
Prediction and early warning for HCV:comparison of three methods
JIANG Chao1, LIU Wen-dong2, HU Jian-li2, et al2     
Department of Epidemiology and Health Statistics, School of Public Health, Nanjing Medical University, Nanjing, Jiangsu Province 211166, China
Abstract: Objective To apply and compare different models in prediction of the trend of hepatitis C virus(HCV)epidemic in Jiangsu province and to provide bases for the control of HCV epidemic.Methods The data on infectious diseases report in Jiangsu province form 1997 to 2009 were collected.Markov chain model and Hole-Winters exponential smoothing forecasting model were used to predict epidemics and control chart was used to detect outbreaks or epidemics of HCV infection.Results Markov chain model predicted that the incidence of HCV from September to December in 2009 would be more than 120 cases and the prediction was consistent with the case number reported.Hole-Winters-additive model(α=0.46,β=0.001,γ=0.001)had good performance in predicting HCV epidemic,with the root mean square error(RMSE)and mean absolute percentage error(MAPE)of 12.6 and 19.1%,respectively.A five-year control chart was chosen as an essential method in early warning system.The early warning threshold for HCV epidemic was 70 percentile and at the threshold level,the sensitivity and specificity for HCV epidemic prediction were over 90%.Conclusion Markov chain model and Hole-Winters exponential smoothing forecasting model are good method for prediction of HCV epidemic and control chart can be used in the early warning.
Key words: prediction     HCV     Markov chain     exponential smoothing     control chart    

丙型肝炎(丙肝)是由丙型肝炎病毒(hepatitis C virus,HCV)感染所致的一种慢性肝脏疾病。HCV是一种折叠的单链核糖核酸病毒,属肝炎病毒黄病毒科家族[1]。自1989年被发现以来,就在世界范围内被认为是导致肝纤维化、肝硬化以及肝细胞癌的主要原因[2, 3, 4, 5]。据报道,全球大约>3%(约1.7亿)的人口感染了HCV[6]。在中国也存在着丙肝疫情暴发的各种隐患。为此,尽早发现传染病暴发的迹象,及时采取有效控制措施,可有效降低丙肝造成的发病和死亡。为分析不同预测预警方法对江苏省丙肝疫情的预测效果,为丙肝的预防控制提供科学依据,本研究收集江苏省传染病疫情管理系统1997—2009年法定报告传染病疫情中丙肝的发病资料,分别建立Markov链模型、Holt-Winters指数平滑模型以及控制图预警模型,比较3种方法对丙肝预测的效果。结果报告如下。 1 资料与方法 1.1 资料来源

资料来源于江苏省传染病疫情管理系统1997年1月—2009年12月法定报告传染病疫情中丙肝的发病资料。 1.2 方法

1.2.1 Markov随机过程方法

当随机过程在时刻tn-1状态已知的条件下,其在时刻tn所处的状态仅与时刻tn-1的状态有关,这样的过程称为Markov过程。有限个Markov过程的整体称为Markov链,它是由状态转移概率联系起来的一个个状态所组成的“链条”,通过研究链内有限Markov过程的状态及相互关系进而预测链内的未来状况,据此作出决策。疾病的发生的走势属于随机过程,根据疾病资料的取值范围可以划分状态,通过计算状态的频数可以求得各个状态的初始概率,然后再求各状态相互转移出现的频数,确定一阶转移概率矩阵。按照式pn=p1n,可求n阶转移概率矩阵,即是预测值状态间的各阶概率矩阵,按照最大转移概率原理即可作出预测。 1.2.2 指数平滑法

指数平滑预测方法通过给近期的观察值以较大的权重,给远期的实际值以较小的权数,使预测值既反映最新的信息,又能反映历史资料的信息,从而使预测结果更符合实际。指数平滑法可以分为一次指数平滑、二次指数平滑以及多参数指数平滑[7]。本研究采用的为Holt-Winter季节迭加模型,该方法用于序列具有线性趋势和加法季节变化的序列。yt平滑后的序列ŷt由下式计算:ŷt+k=at+btk+St+k,t=s+1,s+2,…,T,其中ai表示截距,bt表示斜率,at+btk表示趋势,St为加法模型的季节因子,s表示季节周期长度,月度数据s=12,季度数据s=4。这3个系数有下面的递归式定义: at=α(yt-St-s)+(1-α)(at-1+bt-1);bt=β(at-at-1)+(1-β)bi-1; St=γ(yt-at)+(1-γ)St-s。其中k>0,α、β、γ在0~1,预测值由下式计算: yT+k=aT+bTk+ST+k-s,其中ST+k-s用样本数据最后1年的季节因子。其他模型具体公式参照文献[8]

1.2.3 控制图法

按照控制图法预警模型原理,参考国内外传染病预警的一些方法建立控制图法3年模型和控制图法5年模型2种丙肝流行的预警模型。以研究疾病既往3或5年该月的月发病数作为基线数据,计算指定的百分位数(P50P60P70P80P95)作为候选预警界值,建立预警模型,计算不同预警界值时预警模型的敏感性和特异性,并借助ROC曲线优选出最合适的预警模型及其预警界值。 1.3 统计分析

采用Excel 2003进行数据录入与整理;应用SAS 9.2求转移概率矩阵,采用Eviews 5进行时间序列的分析,应用SPSS 13.0进行统计分析并绘制ROC曲线。 2 结 果 2.1 Markov链模型丙肝疫情预测(图 1表 1)

根据1997—2008年江苏省丙肝发病的时间顺序及发病数大小,按照所规定的发病数取值范围(状态1:X≤25;状态2:25<X≤50;状态3:50<X≤120;状态4:X>120)确定各年度月发病数所处的状态。各年度月发病数及其趋势见图 1。按照各月发病数所处的状态,计算出各状态相互转移出现的次数,建立一阶转移概率矩阵。应用SAS 9.2求出各阶转移概率矩阵:

2009年8月的发病数为156例,处于状态4,在一阶转移概率矩阵中处于第4行,该行以第4列的转移概率(P=0.81)最大,表示状态4向状态4转移,故可认为2009年9月的丙肝发病数处于第4状态,其发病数>120例,P2~P4阶转移概率矩阵中,最大概率均在第4列,分别为0.71、0.65、0.61。据此可推断未来4个月丙肝的发病数均超>120例,与2009年9—12月实际月发病数的164、125、145、138例相一致。
图 1 江苏省1997—2009年丙肝月发病趋势图

表 1 1997—2009年丙肝各月状态转移次数
2.2 转移概率矩阵(表 2、3,图 2)

江苏省1997—2009年丙肝发生病例数总体呈现上升趋势,并且伴随有季节周期性波动,因此选择Holt-Winter季节模型进行拟合和预测。在建模过程中参数值的确定是通过不同参数值的组合进行建模,在参数的选择过程中,要使RMSE最小的模型为最优模型,然后利用最优的参数值组合,通过公式递推出时间序列各时间点的预测值,使拟合和预测达到最佳效果。除此之外MAPE也作为模型拟合效果的评价参考标准。参数设置和最优参数设置如表 2所示,可见Holt-Winter季节迭加模型的RMSE和MAPE 2个指标均低于其他模型,拟合效果较好,因此选择Holt-Winter季节迭加模型对数据进行拟合,将1997—2008年做为训练数据,拟合江苏省实际丙肝发病数,并对2009年各月丙肝发病数做出预测,拟合及预测效果见表 3。Holt-Winter季节迭加模型对2009年各月丙肝发病数的预测相对误差整体较小,除1月的误差略大外,其余各月误差均在较低水平。从宏观分析,该模型对于第2、3季度的预测相对误差较小,效果较好,对于第1、4季度的预测误差较大、效果略差。从图 2可见,Holt-Winter季节迭加模型预测的丙肝发病的趋势与原序列十分接近。

表 2 指数平滑法参数设置和拟合评估

表 3 Holt-Winter季节迭加模型拟合江苏省2009年丙肝月发病数

图 2 Holt-Winter季节相加模型拟合序列与原序列比较
2.3 江苏省2009年丙肝月预警界值计算(图 3)

传染病“流行”系指该疾病的发病水平超过历年一般水平,实际应用时需要对其进行量化。本研究以近5年非流行年发病数为基础,计算丙肝月平均发病数作为基线值,并计算各平均数的s,以作为预警界值判断疾病的流行。将计算所得的基线值代入模型,用各候选预警界值(P50P60P70P80P95)对2009年江苏省丙肝传染病疫情分月进行预警,并借助ROC曲线优选出最合适的预警模型和预警界值。由图 3可见,选用P70作为预警界值时预警模型的灵敏度和特异度均较好。

图 3 不同预警界值下的ROC曲线
3 讨 论

丙肝发病情况的预测预报研究是一项意义深远的工作,也是流行病学研究的重要课题之一。世界卫生组织2010年5月在一次专家共识研讨会上将HCV的慢性感染作为头等重要的公共卫生问题,所有的医疗当局都被邀请加入到努力预防、识别和快速治疗感染的行动中来[9]。本研究将丙肝的月发病数划分为4个状态,利用Markov链方法,根据所分状态,预测2009年9—12月丙肝的发病数均>120例,与实际发病数的164、125、145、138例相符。Markov链预测是区间预测,虽然降低了预测的精确度,但却提高了预测的准确度,在含有未知因素和随机性的情况下预测发病数实际值的范围,对防病更具有现实意义。为跟踪数据的发展,以便于直观疾病的发展趋势,本研究同时采用了指数平滑法进行预测,通过观察数据可以发现江苏省丙肝发生病数总体呈现上升趋势,且伴有季节周期性波动,因此选择Holt-Winter季节模型进行拟合和预测。通过比较发现,Holt-Winter季节迭加模型(α=0.46,β=0.001,γ=0.001)预测效果较好,RMSE和MAPE分别为12.629 85和19.18%。指数平滑法在进行预测时可以得到每个月具体的预测发病数,提高了预测的精度。在对疾病进行预警时,本文采用了5年控制图法,通过ROC曲线筛选,发现将P70作为预警界值时预警模型的灵敏度和特异度均>90%。该方法简单易行,可避免不断对参数进行调整的弊端。

由于在发展中国家HCV感染的流行病学并不能很好的描述其特性。即便在建立很好疾病监测系统的国家,急性病报告系统也会低估HCV感染的发病率[10]。虽然直接测量HCV感染的发病率十分困难,但是仍然可以依赖数学模型推断发病的趋势[7]。本研究直接用发病数的预测来了解未来丙肝的发病情况,将区间预测与点预测结合,对疾病的发展趋势有更全面的了解,为防控决策提高更可靠更准确的依据。

参考文献
[1] 许可,汤奋杨.血液透析及丙肝病毒感染者F蛋白抗体分析[J].中国公共卫生,2012,28(3):333-335.
[2] Thomas HC,Lemon SM,Zuckerman AJ.Viral hepatitis[M].3rd ed,Hoboken:Blackwell Publishing,2005:824-840.
[3] Knipe DM,Howley PM.Field virology[M].5th ed,Philadelphia:Lippincott Williams and Wilkins Immunology,2007:3-4.
[4] Kanwal F,Hoang T,Kramer JR,et al.Increasing prevalence of HCC and cirrhosis in patients with chronic hepatitis C virus infection[J].Gastroenterology,2011,140(4):1182-1188.
[5] 孔晶,储春丽.丙肝病毒F基因对c-myc转录调控作用[J].中国公共卫生,2010,26(12):1508-1510.
[6] Hajarizadeh B,Grebely J,DoreG J.Epidemiology and natural history of HCV infection[J].Nat Rev Gastroenterol and Heptology,2013,10(1038):553-562.
[7] Shepard CW.Global epidemiology of hepatitis C virus infection[J].The Lancet Infectious Disease,2005,5(9):558-567.
[8] 孙敬水.计量经济学[M].清华大学出版社,2004:365-370.
[9] World Health Organization.Global alert and response:hepatitis C[EB/OL].[2013-01-14].http://www.who.int/csr/disease/hepatitis/whocdscsrlyo2003/en/index1.html.
[10] Hagan H,Snyder N,Hough E,et al.Case-reporting of acute hepatitis B and C among injection drug users[J].J Urban Health,2002,79(4):579-585.