文章信息
- 刘秋萍, 王佳敏, 巩超, 高培, 唐迅, 胡永华.
- Liu Qiuping, Wang Jiamin, Gong Chao, Gao Pei, Tang Xun, Hu Yonghua
- 微观模拟模型在流行病学筛查成本效果分析中的应用
- Applications of microsimulation model for cost-effectiveness analysis on screening in epidemiology
- 中华流行病学杂志, 2022, 43(6): 931-937
- Chinese Journal of Epidemiology, 2022, 43(6): 931-937
- http://dx.doi.org/10.3760/cma.j.cn112338-20210802-00601
-
文章历史
收稿日期: 2021-08-02
2. 北京大学医学信息学中心, 北京 100191
2. Peking University Medical Informatics Center, Beijing 100191, China
采用决策模型的理论流行病学方法可以评估筛查等干预措施的长期效果,特别是随机对照试验在伦理或实施可行性受限的情况下,模型研究的结果将提供重要的决策证据。例如,美国预防服务工作组(United States Preventive Services Task Force,USPSTF)采用微观模拟模型(microsimulation model)分析的研究方法,近期更新了结直肠癌和肺癌筛查的推荐指南[1-2]。微观模拟模型是一种基于个体水平的决策模型,即利用人群中与个体水平特征相关的状态转换参数,而不只是人群平均水平的汇总结果进行模型分析,这是与基于群体队列模拟的马尔科夫模型(Markov model)相比最重要的区别[3]。马尔科夫模型需要假设群体中同一状态下的个体具有较高的同质性,但复杂疾病筛查时人群异质性很普遍。异质性是指由于研究对象在基线特征等方面的临床和生物学差异,导致决策模型的参数在不同人群亚组间存在差异[4-5]。不同患者的性别、年龄等特征对疾病发展过程、健康效用和成本等都有影响(例如,疾病的发病率在不同年龄、性别间存在统计学差异),马尔科夫模型需要分别计算不同年龄、性别等亚组人群各自的状态转换概率进行参数估计,以保证满足其同质性假设;但在群体水平上细分的亚组越多,越难保证在各亚组中都能获取到准确的参数[6]。另外,马尔科夫模型还需要假设状态转换概率与之前所处的健康状态及当前健康状态下停留的时间无关,而难以考虑研究对象的疾病史及动态发展轨迹[7]。微观模拟模型能够充分考虑个体特征的异质性以及疾病史对疾病发展的影响,将过去的经历结合到对未来事件发生的预测中,通过健康状态的转换来模拟筛查等干预措施的影响并评价长期效果,因此特别适合复杂疾病筛查的流行病学研究[8]。本文将详细介绍微观模拟模型的基本原理、构建步骤、分析方法及相关注意事项,并结合实例讨论微观模拟模型在流行病学筛查成本效果分析中的应用。
一、基本原理微观模拟模型本质上是一种基于个体水平(即“微观”)模拟的状态转换模型(individual-based state-transition model),采用蒙特卡罗模拟(Monte Carlo simulation)通过产生随机数的方法从健康状态的概率分布中选择个体的状态转换路径,从而模拟个体在模型中的状态转换过程[9]。与马尔科夫模型相似,微观模拟模型由若干个互斥的健康状态组成,将研究期限划分为多个模型周期,在给定周期内每一个体只能处在其中一个健康状态;但与马尔科夫模型仅需要群体水平的汇总数据不同,微观模拟模型需要个体水平的数据,并根据考虑个体特征变化的状态转换概率,模拟个体的状态转换过程[7]。因此,微观模拟模型具有与马尔科夫模型相似的模型基本要素,但可不受限于前述马尔科夫模型的基本假设[9]。
1. 模型构建步骤:为保证研究的透明度,研究者在构建和应用模型时应详细描述模型的假设、结构和参数[10]。模型结构应能够反映所研究的问题,研究者在构建模型之前需要根据以下内容确定模型的构成要素:①决策的角度;②研究对象;③评估的筛查策略及目标疾病;④研究期限(模型周期数及周期长度);⑤所关注的结局,如质量调整生命年(quality-adjusted life years,QALY)和成本等[11]。进行流行病学筛查策略的成本效果分析时,微观模拟模型将分别构建不筛查的自然状态下以及按照筛查策略模拟干预后的健康状态转换模型[8]。微观模拟模型的构建步骤见图 1。其基本构建步骤与马尔科夫模型相似[3],但需要更详细地描述研究对象的特征及状态转换过程。
(1)定义研究对象:微观模拟模型的研究对象是通过从流行病学调查人群中采用蒙特卡罗模拟重复抽样产生的模拟人群(synthetic population),先确定模拟人群的人数(即抽样的次数),对于每一个体,通过产生随机数的方法从变量的分布中抽取相应的数值,每次抽样都得到一组变量的取值(例如,研究对象的基线特征),再将这组数值分配给该个体,如此重复,将得到一群具有不同特征的模拟人群[12]。结合文献及临床知识,需要根据疾病的特点来确定影响模型状态转换概率和结局的特征,如果某些特征影响模型的状态转换概率(例如,影响疾病的发展过程),则研究者在定义研究对象时,需要说明个体的哪些特征将影响模型的状态转换概率和结局[13]。应在模型中对抽样的人数进行定义,一般在10万到100万之间,在现在的计算能力下,模拟百万次对于绝大多数研究来说已经足够,这将决定采用蒙特卡罗模拟进行随机抽样的次数、模型运行的时间及模型结果的稳定性[9]。用于研究对象抽样的流行病学调查人群应具有较好的目标人群代表性,以保证研究结果的可外推性。
(2)定义模型的健康状态及转换过程:模型的健康状态应根据所筛查疾病的特征、研究问题及可获得的数据来定义[8],每一个体的初始健康状态通过研究对象的基线特征确定。为了体现个体的特征和疾病史对疾病发展过程和结局的影响,需要定义状态转换的规则,即建立人群特征及疾病史与状态转换概率和结局等参数之间的联系[14]。筛查策略和干预措施主要通过影响个体的特征和状态转换概率而改变个体的状态转换过程,微观模拟模型能够记录个体的危险因素变化和疾病史,使得模型具有“记忆性”(例如,记录上一周期所处的健康状态、病程长短等)[8],从而可以根据定义的状态转换规则,将记录下来的危险因素变化和疾病史应用到后续的个体状态转换过程中。
(3)模型的参数收集:微观模拟模型的参数众多,模型结果受到参数不确定的影响比马尔科夫模型更大,因此参数的准确性尤为重要。在确定模型结构后,应尽可能全面地检索相关参数,并根据指南的推荐按照一定规范选择参数[15]。研究者需对模型参数的来源、选择依据进行说明,包括参数来源的证据等级、如何控制偏倚、如何对参数进行调整等[16]。当某一参数的信息较少时,应采取保守估计,例如在敏感性分析时设置足够宽的参数变化范围[17]。
(4)模型的校准和验证:当模型参数存在较大的不确定性时,可以设定参数范围从而在目标人群中不断调整模型参数并运行模型,直到选出那些使得模型结果与实际观察到的结果更接近(根据拟合程度判断[18])的参数,这一过程称为模型的校准(calibration)[8]。决策模型是对现实情景的简化,因此还需要评估模型在多大程度上能够反映现实情景,即模型的验证(validation)[4]。模型的校准是模型构建过程中的重要部分,而模型的验证则是对已构建的模型进行评估,因此模型校准在一定程度上将影响模型验证的准确性。
2. 模型分析步骤:对上述已完成构建(包括校准和验证)的微观模拟模型进行分析[14],主要包括基础分析(base-case analysis)和敏感性分析(sensitivity analysis)。
(1)基础分析:对于每一个体,微观模拟模型首先将根据其基线特征确定其第一个周期的健康状态,并分配第一个周期的模型收益;在后续的每个周期内,将记录个体的疾病发生、筛查和治疗等经历,并根据个体的特征和经历确定本周期到下一个周期的状态转换概率。通过蒙特卡罗模拟从个体的各健康状态的概率分布中抽样,确定该个体下一个周期的健康状态,个体经过的每个健康状态都被赋予相应的模型收益,模型将记录个体在状态转换过程中涉及的模型收益的变化。最后,汇总个体在状态转换过程中涉及的模型收益以及所有健康状态的收益,计算该个体从研究初始到结束所对应的模型收益。当模拟人群中的所有个体都完成上述步骤后,最终汇总所有个体的模型收益,从而得到总的模型收益。通过对比不同筛查策略下的模型收益,计算增量成本效果比(incremental cost-effectiveness ratio,ICER)以评价筛查的效果和成本[3]。
(2)敏感性分析:与马尔科夫模型相似[3],微观模拟模型探讨包括人群特征的分布、状态转换概率以及效果、效用等模型参数的不确定性对结果的影响,方法主要包括确定性敏感性分析(deterministic sensitivity analysis,DSA)和概率敏感性分析(probabilistic sensitivity analysis,PSA)[17]。微观模拟模型中每一个体对应一组参数,但进行敏感性分析时需考虑参数变化对所有个体的影响,因此需要选择一个共同的参数变化范围探讨参数的不确定性对结果的影响。概率敏感性分析采用蒙特卡罗模拟的方法,即给每一个体抽取多组参数进行重复计算[19],该方法可评估多个参数范围变化的不确定性对结果的影响,并计算输出结果的置信区间[4]。
3. 统计学软件:根据《中国药物经济学评价指南2020》的建议[15],可采用较常用并容易复现的软件进行微观模拟模型的构建和分析,如TreeAge Pro(http://www.treeage.com/)。
二、研究实例本文以美国CDC开展的多种族人群慢性肾脏病(chronic kidney disease,CKD)筛查的成本效果分析研究为例[20],介绍微观模拟模型的构建和分析。该研究中使用的微观模拟模型来源于前期已校准并验证过的CKD健康政策模型[21]。限于篇幅,本文仅讨论从50岁开始每年进行1次微量蛋白尿筛查,相比于不筛查的成本效果。
1. 模型构建:研究对象来源于美国全国健康和营养调查(National Health and Nutrition Examination Survey,NHANES)数据,采用蒙特卡罗模拟根据基线特征的分布抽样产生100万基线年龄均为30岁的人群,疾病自然发展至50岁,并模拟从50岁起筛查的不同策略对疾病发展过程的影响,直至90岁或死亡。模型的主要假设:①个体的基线特征将影响CKD的发生发展过程;②个体的CKD相关生化指标、危险因素等随时间变化,并影响疾病进展;③个体健康效用及成本与其特征和疾病史有关。CKD筛查的微观模拟模型的概念框架见图 2。其主要考虑的基线特征:包括人口学信息(年龄、性别和种族)、CKD相关生化指标(肾小球滤过率和尿蛋白)、CKD相关危险因素(血压水平、糖尿病等)。根据基线特征确定每一个体的初始状态,并选择筛查及干预路径;根据事先定义的健康状态和状态转换概率模拟疾病的进展。根据指南的定义,模型中主要包括无CKD、CKD 1~5期以及死亡共7个健康状态,每个循环周期结束时研究对象将根据状态转换概率转换到下一个状态。基于人群筛查成本效果分析的决策视角,模型需要收集的参数包括研究对象的基线特征、不同特征的个体在各状态之间转换的概率,以及每个健康状态的健康效用和成本。
微观模拟模型的构建和参数输入在TreeAge Pro软件中的基本操作与马尔科夫模型相似[3]。根据筛查策略和个体所处的健康状态,在树形图(tree diagram)中通过添加分支定义个体的筛查及干预路径,并模拟疾病进展(图 3)。根据表 1中的模型结构描述和软件分析步骤构建微观模拟模型,采用分布(Distributions)来存放研究对象的基线特征分布及事件的发生概率。由于发病率和死亡率的参数较多且与个体特征参数的关系简单,可以通过创建表格(Tables)快速输入参数,来存放不同年龄、性别及种族个体的发病率和死亡率。当参数之间关系复杂时(如涉及条件判断),可通过函数(Functions)建立不同参数之间的关联,函数的输入部分为个体的基线特征或疾病史,输出部分为状态转换概率、健康效用或成本等。由于个体的疾病史(是否出现肾脏受损、糖尿病及心血管病)、肾小球滤过率的变化及治疗经历等都将影响后续的状态转换过程,还需要定义一系列踪迹变量(Tracker variables)放到函数中记录个体的经历。
2. 模型分析:
(1)基础分析:采用蒙特卡罗模拟的分析方法,选中决策结后选择“Analysis > Monte Carlo Simulation > Trials(Microsimulation)”,在“Monte Carlo Simulation”对话框中输入模拟抽样的总人数100万,并设定随机数种子(Seed),例如设为1。筛查效果以QALY表示,并计算ICER,美国人群ICER的阈值定为50 000美元,即低于该阈值,则认为筛查的成本可接受。
(2)敏感性分析:采用单因素敏感性分析探索模型中主要参数(如疾病进展、筛查成本及治疗效果)的不确定性对结果的影响,选中决策结后选择“Analysis > Sensitivity Analysis > Tornado Diagram”,并用旋风图展示。采用蒙特卡罗模拟进行概率敏感性分析,如探讨基线糖尿病患病率的参数变化对结果的影响,可将参数的点值用分布代替,选中决策结后选择“Analysis > Monte Carlo Simulation > Sampling+Trials”,设定模拟次数和随机数种子,估计基础分析结果不确定性的范围。
3. 结果解读:基础分析的结果发现,从50岁起采用微量蛋白尿对CKD进行每年一次筛查的平均QALY和成本分别为19.603年和150 385美元,而不筛查对应的平均QALY和成本分别为19.584年和149 052美元。计算ICER发现每年一次筛查相比于不筛查每获得一个QALY所增加成本为70 862美元,超出了50 000美元的阈值。单因素敏感性分析的结果提示,模型主要参数的取值增加或减少25%,ICER均 > 50 000美元,并且概率敏感性分析也提示了ICER结果的稳健性(图 4)。因此,基于美国多种族的一般人群,从50岁开始采用微量蛋白尿开展每年一次CKD筛查的策略,并不具有优势。
三、总结与展望微观模拟模型已越来越广泛地应用于恶性肿瘤[1-2]、CKD[20]和心血管病[12]等复杂疾病的筛查及干预项目的效果评价[22]。在上述CKD的研究实例中,评估的筛查策略及目标疾病均较复杂。CKD的危险因素水平、病程长短、筛查和治疗经历均会影响疾病发展过程及模型收益,这种影响在评价复杂疾病筛查策略的长期效果时不可忽略。此外,肾小球滤过率和血压水平等变量属于连续变量,采用微观模拟模型还能避免将连续变量转变为分类变量而导致的信息损失。
微观模拟模型和马尔科夫模型都属于状态转换模型,虽然两者在模型要素和软件操作上有相似之处,但也存在着明显的差异[9, 13](表 2)。概括而言,马尔科夫模型结构相对简单,且方法学相对成熟,适用于人群同质性较高,或仅有群体水平汇总数据的情况;而微观模拟模型基于个体水平的数据,可以跟踪个体的疾病史,并在分析中纳入大量个体特征,因而理论上更加精准,适用于人群异质性高,或疾病进展受疾病史影响的复杂情况。需要指出的是,如果忽略人群异质性并采用马尔科夫模型,在成本效果分析中将会导致错误的结果[23]。微观模拟模型建模方法复杂,需要模拟抽样足够多的次数才能使结果代表目标人群的分布[7],消耗大量的计算资源,因而模型运行时间也较长。考虑到抽样的随机性,需要设定相同的种子数以保证不同筛查策略下模拟的个体特征尽可能相似,从而使结果更具可比性[14]。
微观模拟模型的构建,需要研究者较为全面地掌握目标总体中特征变量的分布,以及特征变量之间的关系。影响疾病发生发展(状态转换)的因素纷繁复杂,虽然模型研究中关注的主要变量的分布通常属于经典的参数分布,但当特征变量较多、特征数据类型不一样时,准确了解多个特征的联合分布较为困难,可考虑采用多元正态分布,将联合分布分为边缘分布和条件分布,或采用copulas函数等方法基于联合分布来模拟产生个体化数据[24]。与其他的模型研究类似,微观模拟模型将复杂的疾病进程简化抽象为模型中的健康状态,但这有时并不能反映真实的情景[25]。在实际应用中,应根据拟解决问题的特点选择合适的决策模型,模型结构需符合适度简化原则[13]。为增强研究的透明度,流行病学筛查的成本效果分析也需要遵守相应的报告规范[26],以保证研究结果的可重复性。
综上所述,微观模拟模型基于个体水平的数据对疾病的发展过程进行模拟,充分考虑了状态转换过程中个体特征的异质性以及疾病史对疾病进展的影响,因而更适用于复杂疾病筛查等干预措施长期效果评价的流行病学研究。
利益冲突 所有作者声明无利益冲突
作者贡献声明 刘秋萍:实施研究、统计分析、论文撰写;王佳敏、巩超:采集数据、统计分析、论文审阅;高培:论文审阅;唐迅:设计研究、实施研究、论文撰写;胡永华:研究设计、论文审阅
[1] |
Knudsen AB, Rutter CM, Peterse EFP, et al. Colorectal cancer screening: an updated modeling study for the US preventive services task force[J]. JAMA, 2021, 325(19): 1998-2011. DOI:10.1001/jama.2021.5746 |
[2] |
Meza R, Jeon J, Toumazis I, et al. Evaluation of the benefits and harms of lung cancer screening with low-dose computed tomography: modeling study for the US preventive services task force[J]. JAMA, 2021, 325(10): 988-997. DOI:10.1001/jama.2021.1077 |
[3] |
刘秋萍, 高培, 唐迅, 等. 马尔可夫模型在流行病学筛查成本效果分析中的应用[J]. 中华流行病学杂志, 2021, 42(4): 728-734. Liu QP, Gao P, Tang X, et al. Applications of Markov model for cost-effectiveness analysis of screening in epidemiology[J]. Chin J Epidemiol, 2021, 42(4): 728-734. DOI:10.3760/cma.j.cn112338-20200729-00993 |
[4] |
Petrou S, Gray A. Economic evaluation using decision analytical modelling: design, conduct, analysis, and reporting[J]. BMJ, 2011, 342: d1766. DOI:10.1136/bmj.d1766 |
[5] |
Groot Koerkamp B, Weinstein MC, Stijnen T, et al. Uncertainty and patient heterogeneity in medical decision models[J]. Med Decis Making, 2010, 30(2): 194-205. DOI:10.1177/0272989X09342277 |
[6] |
Hoogendoorn M, Feenstra TL, Asukai Y, et al. Patient heterogeneity in health economic decision models for chronic obstructive pulmonary disease: are current models suitable to evaluate personalized medicine?[J]. Value Health, 2016, 19(6): 800-810. DOI:10.1016/j.jval.2016.04.002 |
[7] |
Caro JJ, Briggs AH, Siebert U, et al. Modeling good research practices-overview: a report of the ISPOR-SMDM modeling good research practices task force—1[J]. Value Health, 2012, 15(6): 796-803. DOI:10.1016/j.jval.2012.06.012 |
[8] |
Rutter CM, Zaslavsky AM, Feuer EJ. Dynamic microsimulation models for health outcomes: a review[J]. Med Decis Making, 2011, 31(1): 10-18. DOI:10.1177/0272989X10369005 |
[9] |
Siebert U, Alagoz O, Bayoumi AM, et al. State-transition modeling: a report of the ISPOR-SMDM modeling good research practices task force-3[J]. Value Health, 2012, 15(6): 812-820. DOI:10.1016/j.jval.2012.06.014 |
[10] |
Eddy DM, Hollingworth W, Caro JJ, et al. Model Transparency and Validation: a report of the ISPOR-SMDM modeling good research practices task force-7[J]. Value Health, 2012, 15(6): 843-850. DOI:10.1016/j.jval.2012.04.012 |
[11] |
Philips Z, Bojke L, Sculpher M, et al. Good practice guidelines for decision-analytic modelling in health technology assessment: a review and consolidation of quality assessment[J]. Pharmacoeconomics, 2006, 24(4): 355-371. DOI:10.2165/00019053-200624040-00006 |
[12] |
Kypridemos C, Allen K, Hickey GL, et al. Cardiovascular screening to reduce the burden from cardiovascular disease: microsimulation study to quantify policy options[J]. BMJ, 2016, 353: i2793. DOI:10.1136/bmj.i2793 |
[13] |
Roberts M, Russell LB, Paltiel AD, et al. Conceptualizing a model: a report of the ISPOR-SMDM modeling good research practices task force-2[J]. Value Health, 2012, 15(6): 804-811. DOI:10.1016/j.jval.2012.06.016 |
[14] |
Krijkamp EM, Alarid-Escudero F, Enns EA, et al. Microsimulation modeling for health decision sciences using R: a tutorial[J]. Med Decis Making, 2018, 38(3): 400-422. DOI:10.1177/0272989X18754513 |
[15] |
刘国恩. 中国药物经济学评价指南2020[M]. 北京: 中国市场出版社, 2020. Liu GE. China guidelines for pharmacoeconomic evaluations 2020[M]. Beijing: China Market Press, 2020. |
[16] |
Sanders GD, Neumann PJ, Basu A, et al. Recommendations for conduct, methodological practices, and reporting of cost-effectiveness analyses: second panel on cost-effectiveness in health and medicine[J]. JAMA, 2016, 316(10): 1093-1103. DOI:10.1001/jama.2016.12195 |
[17] |
Briggs AH, Weinstein MC, Fenwick EA, et al. Model parameter estimation and uncertainty: a report of the ISPOR-SMDM modeling good research practices task force-6[J]. Value Health, 2012, 15(6): 835-842. DOI:10.1016/j.jval.2012.04.014 |
[18] |
van der Steen A, van Rosmalen J, Kroep S, et al. Calibrating parameters for microsimulation disease models: a review and comparison of different goodness-of-fit Criteria[J]. Med Decis Making, 2016, 36(5): 652-665. DOI:10.1177/0272989X16636851 |
[19] |
Hamra G, MacLehose R, Richardson D. Markov chain Monte Carlo: an introduction for epidemiologists[J]. Int J Epidemiol, 2013, 42(2): 627-634. DOI:10.1093/ije/dyt043 |
[20] |
Hoerger TJ, Wittenborn JS, Segel JE, et al. A health policy model of CKD: 2. The cost-effectiveness of Microalbuminuria screening[J]. Am J Kidney Dis, 2010, 55(3): 463-473. DOI:10.1053/j.ajkd.2009.11.017 |
[21] |
Hoerger TJ, Wittenborn JS, Segel JE, et al. A health policy model of CKD: 1. Model construction, assumptions, and validation of health consequences[J]. Am J Kidney Dis, 2010, 55(3): 452-462. DOI:10.1053/j.ajkd.2009.11.016 |
[22] |
Schofield DJ, Zeppel MJB, Tan O, et al. A brief, global history of microsimulation models in health: Past applications, lessons learned and future directions[J]. Int J Microsimul, 2018, 11(1): 97-142. DOI:10.34196/ijm.00175 |
[23] |
Zaric GS. The impact of ignoring population heterogeneity when Markov models are used in cost-effectiveness analysis[J]. Med Decis Making, 2003, 23(5): 379-396. DOI:10.1177/0272989X03256883 |
[24] |
Naveršnik K, Rojnik K. Handling input correlations in pharmacoeconomic models[J]. Value Health, 2012, 15(3): 540-549. DOI:10.1016/j.jval.2011.12.008 |
[25] |
Sanders GD, Maciejewski ML, Basu A. Overview of cost-effectiveness analysis[J]. JAMA, 2019, 321(14): 1400-1401. DOI:10.1001/jama.2019.1265 |
[26] |
Husereau D, Drummond M, Petrou S, et al. Consolidated health economic evaluation reporting standards (CHEERS) statement[J]. BMJ, 2013, 346: f1049. DOI:10.1136/bmj.f1049 |