文章信息
- 陈暐烨, 刘晓非, 沈鹏, 陈奇, 孙烨祥, 邬金国, 路平, 张敬谊, 林鸿波, 唐迅, 高培.
- Chen Weiye, Liu Xiaofei, Shen Peng, Chen Qi, Sun Yexiang, Wu Jinguo, Lu Ping, Zhang Jingyi, Lin Hongbo, Tang Xun, Gao Pei
- China-PAR与WHO模型预测10年心血管病风险的准确性
- Accuracy of the China-PAR and WHO risk models in predicting the ten-year risks of cardiovascular disease in the Chinese population
- 中华流行病学杂志, 2022, 43(8): 1275-1281
- Chinese Journal of Epidemiology, 2022, 43(8): 1275-1281
- http://dx.doi.org/10.3760/cma.j.cn112338-20211206-00952
-
文章历史
收稿日期: 2021-12-06
2. 宁波市鄞州区疾病预防控制中心, 宁波 315100;
3. 万达信息股份有限公司, 上海 201112;
4. 北京大学临床研究所真实世界证据评价中心, 北京 100191;
5. 北京大学分子心血管学教育部重点实验室, 北京 100191
2. Yinzhou District Center for Disease Control and Prevention, Ningbo 315100, China;
3. Wonders Information Co.Ltd, Shanghai 201112, China;
4. Center of Real-world Evidence Evaluation, Peking University Clinical Research Institute, Beijing 100191, China;
5. Key Laboratory of Molecular Cardiovascular Sciences (Peking University), Ministry of Education, Beijing 100191, China
心血管病是目前我国及全球范围内疾病负担的重要原因[1]。采用心血管病风险预测模型开展风险评估已成为西方发达国家心血管病一级预防的重要基础[2]。2019年《中国心血管病风险评估和管理指南》也推荐采用中国动脉粥样硬化性心血管疾病风险预测研究(Prediction for ASCVD Risk in China,China-PAR)的模型在我国人群中评估个体未来10年心血管病的风险[3]。2019年WHO在全球21个区域内更新了心血管病风险预测模型,并发布了针对不同地区人群的评估工具,其中包括中国人群在内的东亚地区。并且,为兼顾模型的准确性和可推广性,WHO模型包括了无实验室指标的简易模型和带有实验室指标的复杂模型两种[4]。考虑到目前对可直接用于中国人群的China-PAR模型和WHO模型的外部验证研究均很少,缺乏用于我国人群心血管病一级预防的风险预测模型准确性的相关证据。对上述预测模型进行外部验证,将会直接影响到风险评估工具在我国人群中的推广和应用,因此本研究拟在社区人群中,独立验证并比较China-PAR模型、WHO东亚人群简易模型和复杂模型的预测准确性,为模型的实际应用评价提供依据。
对象与方法1. 研究对象:来源于中国鄞州电子健康档案研究项目(CHinese Electronic health Records Research in Yinzhou,CHERRY)[5]。CHERRY以浙江省宁波市鄞州区区域卫生信息平台为基础,融合了基本信息数据库、电子病历数据库、健康体检数据库、疾病监测和管理数据库和死亡数据库等[6],构建了一般人群的双向性队列。纳入标准:① 2010年1月1日至2020年5月31日在区域卫生信息平台中有医疗记录,且有效身份识别的健康档案号唯一的居民;②基线年龄在40~79岁(符合预测模型的适用范围)。排除标准:①基线已患有心血管病者;②随访期间无任何一次血脂检测记录者。研究对象选择的流程见图 1。最终纳入225 811名基线无心血管病的研究对象进行分析,研究对象的基线定义为建档时间或最早一次血脂检测时间。本研究已获得北京大学生物医学伦理委员会的批准(审批号:IRB00001052-16011)。
![]() |
注:CHERRY:中国鄞州电子健康档案研究项目 图 1 心血管病10年风险预测模型验证的研究对象入选流程图 |
2. 危险因素的定义:WHO模型[4]和China-PAR模型[7]共同纳入的变量为年龄、性别、吸烟状况和SBP,此外WHO简易模型纳入了BMI,WHO复杂模型纳入了糖尿病病史和TC水平,China-PAR模型还纳入了HDL-C、腰围、降压治疗、地理区域和心血管病家族史。根据模型预测变量的定义,本研究中年龄、性别、居住区域和吸烟状况来源于基本信息数据库,SBP、BMI、腰围、血脂信息来源于电子病历数据库和健康体检数据库,糖尿病病史按国际疾病分类(第10版)(ICD-10)编码定义为E10~E14,提取自疾病监测和管理数据库、体检数据库和电子病历数据库。降压治疗定义为基线时至少服用一种降压药物。对来源于不同数据库的数据,研究者依据统一标准进行了清理及合并[5],参考英国基于电子健康档案的QRISK心血管风险预测模型研究中的方法[6],严格限制危险因素测量时间点在结局事件发生之前,有重复测量记录的危险因素选取距离基线最近一次检测。
3. 结局事件的定义:本研究分别参照WHO模型[4]和China-PAR模型[8-9]使用的结局事件定义,包括非致死性急性心肌梗死、冠心病死亡和致死性或非致死性脑卒中。急性心肌梗死定义为伴有缺血症状、病理性Q波或ST段抬高或压低的心肌坏死生物标志物浓度改变,或进行冠状动脉介入治疗;冠心病死亡包括急性心肌梗死死亡和其他冠心病死亡;脑卒中定义为急性进行性的血管源性的中枢神经系统局灶性或大范围的功能障碍(包括出血性、缺血性脑卒中)超过24 h。CHERRY以每年至少一次的频率更新结局事件信息,本研究定义随访截止时间为研究对象首次出现结局事件、死亡、失访或研究终止时间(2020年5月31日)中最早的时间记录。
4. 质量控制:本研究中的区域卫生信息平台的数据由万达信息股份有限公司进行链接及初步核查;生化检测指标由当地体检或医疗机构检测后直接导入系统中,并由研究者对来自不同数据库的数据按照统一标准进行清理及合并[5];系统中的心血管病结局事件诊断由专业医生在浙江省疾病监测及死因登记平台核查确认,均采用ICD-10编码记录疾病类型和死因,时间记录明确。
5. 统计学分析:研究对象基线特征的连续变量采用x±s和M(Q1,Q3)描述,分类变量采用频数(%)描述。10年心血管病结局事件的实际发生率采用Kaplan-Meier法估计,预测风险分别采用WHO东亚人群简易模型、复杂模型或China-PAR模型中各自的参数分性别进行计算。模型预测准确性的比较包括区分度和校准度[10],区分度表示正确区分具有不同发病风险个体的能力,采用C统计量(Harrel's Concordance index)评估,一般认为C统计量 > 0.7时区分度较好。校准度反映群体水平上模型的预测风险与实际风险的一致程度,按照预测风险将人群分为10组作图表示预测与实际的风险,并采用Hosmer-Lemeshow法检验。根据WHO《心血管风险评估和管理指南》[11]和《中国心血管病风险评估和管理指南》[3]的建议,将研究对象按照10年心血管病预测风险分为4类(< 5.0%、5.0%~9.9%、10.0%~19.9%和≥20.0%),分别比较每类中的10年心血管病实际发生率和预测风险。此外,计算预测风险与实际发生率的比值(expected-observed ratio,EOR),EOR < 1表示低估风险,EOR > 1表示高估风险[12]。针对研究对象预测变量的缺失数据,本研究采取国际通用的多重链式填补的方法对变量进行填补,最终估计的统计量采用Rubin's rule合并[13]。采用Stata 16.0软件进行统计学分析,均为双侧检验,P < 0.05为差异有统计学意义。
结果1. 基本特征:本研究共纳入225 811人,平均年龄为54.96岁,53.3%为女性。研究对象在SBP(13.09%)、腰围(17.34%)、BMI(3.51%)和地理区域(0.71%)上存在一定程度的缺失。有血脂测量的人群与无血脂信息的人群相比,总体上年龄、腰围、BMI、血压水平更高,糖尿病患者比例更高。研究对象的基线特征见表 1;男性的年龄、吸烟比例、腰围、BMI和SBP水平均高于女性,而TC和HDL-C水平均低于女性(均P < 0.01)。由于模型使用的结局事件定义不同,根据China-PAR模型的结局事件定义[7-8],在中位7.38(4.92,9.21)年的随访期间内,共发生9 703例心血管病事件,其中男性5 147例(4.88%),女性4 556例(3.79%),Kaplan-Meier法调整后的10年心血管病事件发生率男性(7.77%)高于女性(5.93%)(P < 0.01);根据WHO模型[4]的结局事件定义,在中位7.26(4.85,9.16)年的随访期间内,共发生13 301例心血管病事件,其中男性6 777例(6.42%),女性6 524例(5.42%),Kaplan- Meier法调整后的10年心血管事件发生率同样显示男性(10.30%)高于女性(8.51%)(P < 0.01)。
2. 男性中WHO模型与China-PAR模型的验证:在男性中WHO复杂模型与简易模型的C统计量分别为0.747(95%CI:0.740~0.753)和0.739(95%CI:0.733~0.746),China-PAR模型的C统计量为0.741(95%CI:0.735~0.747)。与Kaplan-Meier法调整后的10年心血管病实际发生数相比,WHO简易模型和复杂模型预测准确性优于China-PAR模型,WHO简易模型和复杂模型在男性10年心血管病风险预测中分别低估了4.4%和0.8%,而China-PAR模型则低估了19.5%(表 2)。
根据WHO和中国指南的风险分组,分别比较各模型在男性各风险分类中的预测情况(图 2),发现在预测风险最高组(风险≥20.0%)和次高组(风险10.0%~19.9%),China-PAR模型均低估风险(分别为34.6%和29.7%),而WHO简易模型和复杂模型在次高组估计准确,但在最高组分别低估19.1%和15.9%。进一步按照预测风险10分位数分组绘制模型的校准图(图 3),同样发现China-PAR模型在较高风险组明显低估了风险,WHO模型在中低风险组对10年心血管病风险略有高估,在最高风险组出现了低估。对各模型预测的最高风险组(前10%)的人群特征分析发现,WHO模型发现的大部分为年龄≥65岁老年人群(简易模型90.9%和复杂模型87.8%),而China-PAR模型和WHO复杂模型发现的糖尿病患者的比例(24.8%和25.4%)比WHO简易模型(11.6%)明显更高。
![]() |
图 2 10年心血管病事件发生率与WHO模型和China-PAR模型预测值的比较 |
![]() |
图 3 WHO模型和China-PAR模型用于10年心血管病风险预测的校准图 |
3. 女性中WHO模型与China-PAR模型的验证:在女性中WHO复杂模型与简易模型区分度C统计量分别为0.789(95%CI:0.783~0.795)和0.782(95%CI:0.776~0.787),China-PAR模型为0.782(95%CI:0.776~0.788)。与Kaplan-Meier法调整后的10年心血管病实际发生数相比,WHO简易模型和复杂模型预测准确性均较好,而China-PAR模型预测准确性较差。WHO简易模型和复杂模型预测风险均低估了约15%,China-PAR模型则低估了约42%(表 2)。
风险分组显示,在女性中预测风险最高组(风险≥20.0%)和次高组(风险10.0%~19.9%),China-PAR模型低估情况(48.3%和53.1%)严重,WHO简易模型分别低估36.6%和23.7%,WHO复杂模型分别低估33.8%和21.3%(图 2)。模型的校准图显示,WHO模型在女性中对心血管病风险预测的偏离方向与在男性中类似,但偏离程度更高;China-PAR模型在女性的各个风险组中均出现低估,且低估程度比在男性中更严重(图 3)。与男性中类似,女性中各模型预测的最高风险组(前10%)的人群特征显示WHO模型发现的大部分为年龄65岁及以上的老年人群(简易模型94.3%和复杂模型86.4%),而China-PAR模型和WHO复杂模型发现的糖尿病患者的比例(41.4%和37.4%)同样明显高于WHO简易模型(17.3%)。
讨论基于风险评估的心血管病一级预防策略已被西方发达国家的指南广泛接受,2019年的《中国心血管病风险评估和管理指南》推荐采用China-PAR模型对≥35岁个体进行风险评估[3],但目前我国仍缺乏对风险预测模型准确性的外部验证研究,导致基层一级预防实践中缺乏充足的证据来选择合适的风险评估工具。
本研究在大样本的社区人群队列中发现,在我国人群总体风险评估中China-PAR和WHO模型的区分度均较好,但China-PAR和WHO模型对于10年心血管病风险均出现低估,且China-PAR模型低估更严重,其他地区的房山队列研究和广州生物银行队列研究也发现China-PAR模型在女性中的预测准确性有待改善[8, 14-15]。由于China-PAR模型在男性比女性中多纳入了城乡、心血管病家族史以及年龄与其他变量的交互作用,提示这些变量可能对模型的预测准确性有影响。与本研究结果类似,在新疆维吾尔自治区和内蒙古自治区的维吾尔族、哈萨克族和蒙古族人群中的研究也发现China-PAR模型存在不同程度的风险低估[16-17],但房山队列研究提示China-PAR模型对5年心血管病风险略有高估[9]。我国不同地区心血管病及其危险因素的差异较大,尽管China-PAR模型中已经包括了反映区域差异的变量,但还需更多的外部验证研究的结果确定其实际应用的准确性。
2019年WHO根据全球21个地区的心血管病及其危险因素水平的统计数据,通过再校准的方法更新了模型[4],改善了模型的可推广性,并利于进行国际比较。本研究发现WHO模型的区分度在女性中更好,与WHO在亚太队列研究的中国数据和中国多省市心血管病队列中的验证结果类似(区分度C统计量为0.738)[4]。目前仅有在China-PAR队列人群中对WHO模型的独立验证,该研究显示WHO简易和复杂模型都高估了10年心血管病风险[18]。China-PAR队列人群,与本研究人群相比基线时间较早,考虑到我国心血管病负担仍然处于增长阶段[19],有必要利用更新的数据验证模型的准确性。另外,与China-PAR研究采用的人群募集的传统队列设计不同,本研究人群在一定程度上可以反映基层实践中的真实世界场景。
考虑到大多数基层实践应用模型的时候不具备模型再校准的队列资源,因此本研究对于WHO模型和China-PAR模型的评价分别采用了其各自原始研究的结局定义,以便于准确评估原始模型的预测能力。预测模型在基层实践中的可推广性还受到模型中预测变量的可及性影响[20]。相比于China-PAR模型,WHO模型涉及的变量更少,在基层一级预防实践中可能更便利。值得注意的是,无论China-PAR还是WHO模型对于最高风险组人群的预测准确性还有待改善,提示仍需进一步针对高风险的糖尿病或老年人群开发单独的风险预测模型。此外,本研究显示WHO简易模型的准确性与WHO复杂模型相近,提示基层在缺乏血脂测量的条件下可以先使用WHO简易模型进行总体风险评估的初筛,然后再采用复杂模型序贯筛查的方式,以兼顾成本和收益。
本研究存在局限性。首先,预测变量存在数据缺失的情况,但本研究采用了多重填补的方法,一定程度上降低了选择偏倚;其次,本研究排除了无任何一次血脂测量的人群,这部分无血脂测量的人群虽然在基线特征上存在一定差异,但考虑到其主要是低风险人群,并不影响本研究的结论;最后,本研究人群来自我国沿海发达地区,结论的外推性受限,后续研究需要在其他人群中进一步验证。
综上所述,本研究在我国社区人群的大样本队列中验证了China-PAR和WHO模型预测10年心血管病风险,发现模型在总体风险评估中均具有较好的区分度,但对于高风险组人群的预测准确性还有待改善,提示仍需进一步针对高风险组(如糖尿病或老年)人群建立单独的风险预测模型。
利益冲突 所有作者声明无利益冲突
作者贡献声明 陈暐烨:研究设计、分析/解释数据、文章撰写;刘晓非:研究设计、分析/解释数据;沈鹏、陈奇、孙烨祥、邬金国、路平:采集数据、行政或技术支持;张敬谊、林鸿波:支持性贡献;唐迅、高培:研究设计、获取研究经费;所有作者均对文章的知识性内容作批评性审阅
[1] |
GBD 2019 Diseases and Injuries Collaborators. Global burden of 369 diseases and injuries in 204 countries and territories, 1990-2019: a systematic analysis for the Global Burden of Disease Study 2019[J]. Lancet, 2020, 396(10258): 1204-1222. DOI:10.1016/s0140-6736(20)30925-9 |
[2] |
Lloyd-Jones DM, Braun LT, Ndumele CE, et al. Use of risk assessment tools to guide decision-making in the primary prevention of atherosclerotic cardiovascular disease: a special report from the American heart association and American college of cardiology[J]. J Am Coll Cardiol, 2019, 73(24): 3153-3167. DOI:10.1016/j.jacc.2018.11.005 |
[3] |
中国心血管病风险评估和管理指南编写联合委员会. 中国心血管病风险评估和管理指南[J]. 中华预防医学杂志, 2019, 53(1): 13-35. The Joint Task Force for Guideline on the Assessment and Management of Cardiovascular Risk in China. Guideline on the assessment and management of cardiovascular risk in China[J]. Chin J Prev Med, 2019, 53(1): 13-35. DOI:10.3760/cma.j.issn.0253-9624.2019.01.004 |
[4] |
Kaptoge S, Pennells L, de Bacquer D, et al. World Health Organization cardiovascular disease risk charts: revised models to estimate risk in 21 global regions[J]. Lancet Global Health, 2019, 7(10): e1332-1345. DOI:10.1016/s2214-109x(19)30318-3 |
[5] |
Lin HB, Tang X, Shen P, et al. Using big data to improve cardiovascular care and outcomes in China: a protocol for the CHinese Electronic health Records Research in Yinzhou (Cherry) Study[J]. BMJ Open, 2018, 8(2): e019698. DOI:10.1136/bmjopen-2017-019698 |
[6] |
Hippisley-Cox J, Coupland C, Brindle P. Development and validation of QRISK3 risk prediction algorithms to estimate future risk of cardiovascular disease: prospective cohort study[J]. BMJ, 2017, 357: j2099. DOI:10.1136/bmj.j2099 |
[7] |
孙烨祥, 吕筠, 沈鹏, 等. 健康医疗大数据驱动下的疾病防控新模式[J]. 中华流行病学杂志, 2021, 42(8): 1325-1329. Sun YX, Lyu J, Shen P, et al. A new model for disease control and prevention driven by big data in healthcare[J]. Chin J Epidemiol, 2021, 42(8): 1325-1329. DOI:10.3760/cma.j.cn112338-20210510-00383 |
[8] |
Yang XL, Li JX, Hu DS, et al. Predicting the 10-Year risks of atherosclerotic cardiovascular disease in Chinese population: The China-PAR Project (Prediction for ASCVD Risk in China)[J]. Circulation, 2016, 134(19): 1430-1440. DOI:10.1161/CIRCULATIONAHA.116.022367 |
[9] |
Tang X, Zhang DD, He L, et al. Performance of atherosclerotic cardiovascular risk prediction models in a rural Northern Chinese population: Results from the Fangshan Cohort Study[J]. Am Heart J, 2019, 211: 34-44. DOI:10.1016/j.ahj.2019.01.009 |
[10] |
Alba AC, Agoritsas T, Walsh M, et al. Discrimination and calibration of clinical prediction models: users' guides to the medical literature[J]. JAMA, 2017, 318(14): 1377-1384. DOI:10.1001/jama.2017.12126 |
[11] |
World Health Organization. Prevention of cardiovascular disease: guidelines for assessment and management of total cardiovascular risk[M]. Switzerland: WHO Press, 2007.
|
[12] |
Cook NR, Ridker PM. Calibration of the pooled cohort equations for atherosclerotic cardiovascular disease: an update[J]. Ann Intern Med, 2016, 165(11): 786-794. DOI:10.7326/M16-1739 |
[13] |
Marshall A, Altman DG, Holder RL, et al. Combining estimates of interest in prognostic modelling studies after multiple imputation: current practice and guidelines[J]. BMC Med Res Methodol, 2009, 9: 57. DOI:10.1186/1471-2288-9-57 |
[14] |
Huang YY, Tian WB, Jiang CQ, et al. A simple model for predicting 10-year cardiovascular risk in middle-aged to older Chinese: Guangzhou Biobank cohort study[J]. J Cardiovasc Transl Res, 2022, 15(2): 416-426. DOI:10.1007/s12265-021-10163-3 |
[15] |
唐迅, 张杜丹, 何柳, 等. China-PAR模型在北方农村人群中预测动脉粥样硬化性心血管疾病发病风险的应用[J]. 北京大学学报: 医学版, 2017, 49(3): 439-445. Tang X, Zhang DD, He L, et al. Application of the China-PAR risk prediction model for atherosclerotic cardiovascular disease in a rural northern Chinese population[J]. J Peking Univ: Health Sci, 2017, 49(3): 439-445. DOI:10.3969/j.issn.1671-167X.2017.03.011 |
[16] |
Zeng NM, Zheng XW, Peng H, et al. Validation of the China-PAR equations for cardio-cerebrovascular risk prediction in the inner Mongolian population[J]. Biomed Environ Sci, 2018, 31(6): 463-466. DOI:10.3967/bes2018.061 |
[17] |
Jiang YX, Ma RL, Guo H, et al. External validation of three atherosclerotic cardiovascular disease risk equations in rural areas of Xinjiang, China[J]. BMC Public Health, 2020, 20(1): 1471. DOI:10.1186/s12889-020-09579-4 |
[18] |
Li JX, Liu FC, Yang XL, et al. Validating World Health Organization cardiovascular disease risk charts and optimizing risk assessment in China[J]. Lancet Reg Health West Pac, 2021, 8: 100096. DOI:10.1016/j.lanwpc.2021.100096 |
[19] |
Liu SW, Li YC, Zeng XY, et al. Burden of cardiovascular diseases in China, 1990-2016: findings from the 2016 Global burden of disease study[J]. JAMA Cardiol, 2019, 4(4): 342-352. DOI:10.1001/jamacardio.2019.0295 |
[20] |
Wolff RF, Moons KGM, Riley RD, et al. PROBAST: a tool to assess the risk of bias and applicability of prediction model studies[J]. Ann Intern Med, 2019, 170(1): 51-58. DOI:10.7326/M18-1376 |