Economic evaluation on breast cancer screening in mainland China: a systematic review
Program Office for Cancer Screening in Urban China, National Cancer Center/Cancer Hospital, Chinese Academy of Medical Sciences and Peking Union Medical College, Beijing, 100021, China (Wang L, Shi JF, Huang HY, Zhu J, Li J, Dai M); Department of Breast Oncology (Fang Y)
Fund program: National Natural Science Foundation of China (81402740); Specialized Research Fund for the Doctoral Program of Higher Education (20131106120014); National Key Public Health Program of China-Cancer Screening Program in Urban China
乳腺癌已成为全球女性发病与死亡首位恶性肿瘤,并造成伤残调整生命年(DALY)逐年加重[1]。2015年乳腺癌位列我国女性肿瘤发病首位,其新发和死亡分别达到26.9万例和7.0万例[2]。自20世纪80年代全球多国相继开展以钼靶为主的乳腺癌筛查项目,证实可降低乳腺癌的死亡率,但存在假阳性及过度诊断等危害[3-5]。另一方面,基于模型的经济学评价广泛开展,其结果也逐渐用于决策参考[6]。但不同国家其疾病负担及卫生资源存在较大差异[7],筛查项目的经济学评价结果不尽相同[8],因此,亟需开展我国人群特异性的乳腺癌筛查卫生经济学评价。近年来我国也启动了乳腺癌筛查项目[9-10]。但不同筛查项目其目标人群、筛查起止年龄、筛查技术等存在差别,何种筛查方案最适宜我国女性,更符合成本效果原则尚不能确定。尽管我国乳腺癌筛查的经济学评价结果也有报道[11],但缺少证据整合及系统评价。因此,本文拟通过系统综述,对我国内地乳腺癌筛查的卫生经济学研究进行检索归纳,对研究基本信息、人群项目参与率及检出率、模型研究方法学、经济学评价方法与结果以及报告质量等进行汇总和比较,以期为下一步的研究提供参考。
资料与方法
1.检索方法:在PubMed、中国知网、万方数据知识服务平台和维普网4个数据库中,以“breast neoplasms”、“mass screening”、“economic evaluation”和“China”为MESH主题词结合“breast cancer”、“screening”、“cost effectiveness analysis”、“cost utility analysis”、“cost benefit analysis”、“cost analysis”和“economic evaluation”为自由词检索PubMed,以“乳腺癌”、“乳腺肿瘤”、“筛查”、“普查”、“成本分析”、“成本效果”、“成本效益”、“成本效用”、“卫生经济学评价”主题词检索中文数据库。检索时间范围为1995年1月至2015年12月。补充检索Health Economic Evaluation Database、National Health Service Economic Evaluation Database和CEA Registry等卫生经济学文献库。
2.纳入和排除标准:纳入标准(须同时满足)为①我国大陆人群;②基于人群项目或构建模型评价乳腺癌筛查;③采用成本分析(CA)、成本-效果分析(CEA)、成本-效用分析(CUA)和成本-效益分析(CBA)中一种或多种;④评价数据可获得。排除标准包括①药物、手术等非筛查干预;②综述、述评等二次研究;③重复发表数据。见图 1。
3.信息摘录:制定文献信息摘录表,包括基本信息(发表时间、地区、目标人群、筛查方案)、人群项目参与率及检出率、选用模型方法学介绍(采用模型、循环周期、时间范围、自然史状态及参数设置等)、经济学评价方法学(评价基础、评价方法、评价角度、贴现率、成本收集等)及结果信息。由2名研究人员独立进行信息摘录,意见不一致时,提交课题组讨论决定。
4.质量评价:采用卫生经济学评价报告规范(CHEERS)评价文献报告质量[12]。CHEERS由国际药物经济学与结果研究协会(ISPOR)制定的用于经济学评价文献报告质量评价,规范分为6大类24个条目,包括标题和摘要、背景介绍、方法、结果、讨论及其他内容。参照已有文献[13],对纳入研究参照各条目依次评估,完全报告计1分(Y),不完全报告计0.5分(P),未报告计0分(N),单篇文献最高计24分,单个条目最高计13分。由两名研究人员独立开展报告质量评价,意见出现不一致时,由小组讨论决定。
5.数据处理:重新计算人群项目筛查效果,具体指标定义:检出率(/10万)=检出乳腺癌例数/参与筛查人数×100 000;早期检出率(/10万)=检出早期乳腺癌例数/参与筛查人数×100 000,早期乳腺癌参照美国癌症联合会的分期指南[14],定义为0~I期。计算经济学评价结果,成本效果比=成本/效果指标,效果包括检出1例乳腺癌、挽救1个生命年等;成本效用比=成本/效用指标,效用指标包括获得一个质量调整生命年(QALY)和DALY;针对CUA计算增量成本效果比(ICER),ICER=(筛查组成本-对照组成本)/(筛查组效用值-对照组效用值)。
结果
1.文献基本信息:截至2016年3月2日,初检中国知网、万方数据知识服务平台、维普网和PubMed,分别获得118、141、68和29篇,经查重、阅读摘要和标题及进一步阅读全文后排除343篇,进一步补充检索CEA Registry等数据库无文献更新,最终纳入13篇文献[15-27]。13篇均发表于2012-2015年;英文文献1篇,中文文献来自期刊8篇,学位论文4篇;11篇基于人群项目评价,仅3篇基于模型评价,初菁菁[20]同时开展基于人群项目和模型评价;研究对象城乡分布较均衡。
2.目标人群及筛查方案:13篇文献的筛查目标人群及筛查方案见表 1。其中2篇研究整合同一团队前期发表结果[28-29]。除3篇文献选择以高危人群为筛查对象[15, 18, 23],其余文献均选择普通人群;就筛查起止年龄而言,起始年龄在18~45岁,7篇研究选择35岁[16-17, 19, 21-23, 25],终止年龄均选择≥59岁。评价项目以组织性筛查为主(11篇),选用筛查技术以单一技术或多种技术组合,5篇研究采用单独钼靶筛查[15, 17, 22, 26-27],4篇采用乳腺临床检查与超声并联筛查,阳性者转钼靶筛查[17, 20, 24-25]。就筛查频率而言,8篇选择1次/年,4篇选择终生1次。对照组选择中,3篇文献未设置对照组,剩余10篇选择不同对照组。
3.基于人群研究项目参与率及检出率:11篇文献基于人群项目研究[15-25],其样本量M=12 515(1 034~2 872 647)例。仅有2篇报道了项目参与率情况[15, 21],分别是11.4%与28.0%;检出率结果方面,10篇研究乳腺癌检出率M=134.9(28.8~526.1)/10万;6篇报道早期检出率M=41.3(8.2~231.2)/10万[15, 19-23, 25]。细化分析显示,机会性筛查项目的中位检出率(364.2/10万)[16, 22, 24]明显高于组织性项目(94.1/10万)[15-16, 18-21, 23, 25];城市人群中位检出率(183.5/10万)[16, 18, 24]高于农村人群(53.1/10万)[20-21, 23, 25];采用不同筛查技术其检出率也存在差别,其中钼靶并联超声中位检出率最高(386.8/10万)[15, 18, 22],临床检查、超声和钼靶串联筛查检出率最低(44.4/10万)[19, 23]。见表 2。
4.基于模型研究的疾病自然史状态及参数设置:3篇研究基于Markov模型进行评价[20, 26-27]。模拟乳腺癌自然史状态主要包括健康、癌症和死亡;癌症分期细化信息包括原位癌和Ⅰ~Ⅳ期乳腺癌[27],及根据病理确诊分为真阳性和假阳性乳腺癌[20]。相关参数及来源情况:1篇研究参数较为完整,年龄别的乳腺癌发病率、死亡率、全死因死亡率和筛查技术准确性均选用我国人群特异性数据,但未报道状态间转移概率[26];1篇研究仅报道选用项目中筛查技术准确性,无其他参数呈现[27];3篇文献均未报道我国人群特异性的乳腺癌生存率及健康效用值参数。敏感性分析:3篇均采用单因素敏感性分析,1篇补充概率敏感性分析[20](表 3)。
表 3 3篇模型研究相关文献的自然史状态及参数设置
5.卫生经济学评价方法学:①评价方法:CEA最多11篇[15-16, 18-25, 27],4篇CUA[18, 20-21, 26],3篇CBA[18, 21, 25]和1篇CA[17];②研究角度:7篇文献报道,其中5篇为政府等服务提供方角度[15, 20, 23-25],2篇社会角度[16-17];③贴现率:仅有5篇研究报道,其中3篇对成本和效果均进行贴现[18, 26-27],2篇仅贴现成本[16, 20],贴现率分为3%和5%两类;④评价年限:除3篇文献外[17-18, 27],10篇文献报道了评价年限,M=2.5(1~30)年(表 4)。
6.卫生经济学评价:9篇CEA选用检出1例乳腺癌的成本为评价指标[15, 18-25],M=144 866(49 700~2 293 000)元。4篇CUA中,2篇以获得1个QALY为指标[20, 26],范围是72~410元;2篇以避免1个DALY为指标[18, 21],范围是1 574~3 777元。仅有3篇文献采用CBA且其结果指标定义存在差别[18, 21, 25]。3篇CUA可获得ICER;其中初菁菁[20]获得1个QALY的成本为14 603元,张峰等[26]获得1个QALY的成本是216 656~270 746元,张欣[18]避免1个DALY的成本是2 881~14 572元(表 4)。
7.文献报告质量评估:表 5汇总了文献报告质量得分情况。13篇文献平均得分14.5(9.5~21.0)分;其中在研究角度、贴现率、成本和效果增量、不确定性分析、利益冲突等维度得分不足6.0分。对比人群研究与模型研究平均得分,分别是13.4分与18.3分,模型研究整体文献报告更为规范。
讨论
本文系统汇总了我国大陆地区乳腺癌筛查的卫生经济学研究,提示目前研究尚处起步阶段,不同研究间评价方法及结果可比性较差,文章报告质量偏低,尚不能确定何种筛查方案最适用于我国大陆人群。
国际上常用经济学评价方法是以DALY或QALY为指标的CUA[30-31],与检出癌症例数等中间指标相比,QALY或DALY的优势在于综合考量了生命的长度和质量,本文中4篇研究采用CUA且仅可获得3篇研究的ICER[18, 20, 26]。按照WHO参考意见:对比ICER与本国人均GDP,ICER < 人均GDP,很符合成本效果,人均GDP < ICER < 3倍人均GDP,符合成本效果,ICER > 3倍人均GDP,不符合成本效果[32]。参考2015年我国人均GDP(49 351元)后发现,张欣[18]及初菁菁[20]采用的筛查方案符合成本效果,张峰等[26]采用的筛查方案尚不符合成本效果。细化分析发现,张欣[18]同一项目中不同筛查方案间成本差别较小,ICER计算分子较小;初菁菁[20]不同项目间筛查效果差别较大,ICER计算分母较大,因此两项研究结论更支持乳腺癌筛查;张峰等[26]研究是少见的结论不支持乳腺筛查的模型研究,探究其原因,注意到模型参数对ICER影响颇大,如单次钼靶成本由200元降至170元时,其ICER由216 656元降至9 813元,乳腺癌发病率、筛查灵敏度及特异度等参数敏感性分析也出现类似结果,提示该模型不稳定。
研究角度是开展经济学评价的先决条件之一。资源和成本核算可分为政府、医院等医疗服务提供方、患者和社会等角度[33]。本文中部分研究角度,其中政府等服务提供方居多,仅有的2篇社会角度研究稍有区别,杨岚等[17]仅关注筛查相关成本,而莫淼等[16]偏重治疗成本,筛查成本测算相对简单。目前而言,国际上认可度较高的精确核算方法之一是微观成本核算[33],Shi等[34]采用该方法对我国宫颈癌筛查诊治相关成本进行了详细核算和报道,可对今后乳腺癌筛查诊治成本核算提供借鉴。
经济学评价可回答乳腺癌筛查人群项目的投入与产出关系,但由于人群项目其筛查方案相对固定、终点结局较难获得等,模型研究得到广泛开展[6]。本文结果显示,与人群研究相比,模型研究评价年限更长,评价方法更优(CUA),且报告质量更高。3篇模型研究均采用的Markov模型在经济学评价中应用最为广泛[6],包括疾病自然史状态与参数两个重要板块,均高度需要循证证据。文中3模型的人群特异性及循证级别有限,一方面,模型结构多借鉴已有文献报道,缺少我国人群流行病学数据调试;另一方面,选用参数多基于单篇报道或自身筛查项目数据,生存率及健康效用参数完全采用国外数据。因此,下一步研究可考虑建立适用于我国大陆女性的疾病自然史模型,同时结合系统综述及现场研究汇总高质量的参数证据。
本研究采用CHEERS量表评价乳腺癌筛查相关的卫生经济学研究,结果提示总体得分偏低,尤其是研究角度、贴现率、成本和效果增量、不确定性分析等板块。在此之前,CHEERS量表已应用于多种疾病的经济学评价并受到广泛认可[13, 35-36],其结果解读时评分仅代表研究报告质量,不能直接推断研究设计好坏及是否存在偏倚。本研究推荐研究人员参考CHEERS量表,科学开展经济学评价并规范撰写报告,从而对比不同研究结果以提供更好的决策依据。
本文存在局限性。首先,可能漏检文献,如英文文献仅检索PubMed,尽管补充检索了CEA Registry等经济学文献平台,仍不能排除漏检可能。其次,本文结果尚不能回答何种筛查方案最适宜我国人群,其原因在于纳入研究的目标人群、筛查方案、研究角度、成本收集及评价方法等存在较大差异。此外使用的CHEERS三分类评分同样存在高估可能。
研究结果预期可为将来工作提供参考。下一步研究可着手构建我国女性特异性的乳腺癌自然史模型,同时以社会角度全面核算筛查诊治相关成本。在此基础上,对不同筛查技术、筛查起止年龄、筛查频率、组织方式等多种筛查方案的内容进行综合分析,尤其是以QALY或DALY为评价指标的成本效用分析。最后,也建议借助国际认可度高的规范或指南,对后期卫生经济学研究设计及报告撰写进行质量控制。
致谢:
感谢中国医学科学院肿瘤医院任建松、李霓;山东省肿瘤医院马恒敏;中国医学科学院医学信息研究所岳馨培;甘肃省肿瘤医院陈莉莉和浙江省肿瘤医院朱陈等老师对文献检索、信息摘录及文章修改的予以协助指导,北京大学卫生发展研究中心方海和徐婷婷老师对CHEERS量表使用的指导和帮助
利益冲突:
无