肿瘤防治研究  2022, Vol. 49 Issue (3): 197-204
本刊由国家卫生和计划生育委员会主管,湖北省卫生厅、中国抗癌协会、湖北省肿瘤医院主办。
0

文章信息

肺腺癌患者列线图预后模型的构建与验证
Construction and Validation of A Nomogram Prognostic Model for Patients with Lung Adenocarcinoma
肿瘤防治研究, 2022, 49(3): 197-204
Cancer Research on Prevention and Treatment, 2022, 49(3): 197-204
http://www.zlfzyj.com/CN/10.3971/j.issn.1000-8578.2022.21.0623
收稿日期: 2021-06-02
修回日期: 2021-11-19
肺腺癌患者列线图预后模型的构建与验证
罗文卿1 ,    李源奇2 ,    叶飞1 ,    李强明1 ,    张国庆1 ,    李向楠1     
1. 450052 郑州,郑州大学第一附属医院胸外科;
2. 410012 长沙,中南大学湘雅公共卫生学院
摘要: 目的 基于SEER数据库的大样本数据,构建肺腺癌患者生存预后的列线图预测模型。方法 回顾性分析SEER数据库收集的2010—2015年诊断为肺腺癌患者的临床数据。根据影响肺腺癌患者预后的独立因素,采用Lasso Cox回归分析构建列线图模型。C指数和校准曲线评估列线图的判别和校准能力。使用NRI和DCA曲线评估列线图的预测能力和净收益。结果 共确定了15个影响肺腺癌预后的独立危险因素,并将其整合到列线图模型中。预测模型建模组的C指数为0.819,验证组的C指数为0.810。建模组和验证组校准曲线预测的1、3和5年特异性生存率与实际特异性生存率吻合较好。NRI和DCA曲线表明,列线图预测模型的预测能力和净收益均优于第7版AJCC TNM分期系统。以此模型构建的风险分层模型能够很好地区分出不同风险的患者(P < 0.0001)。结论 成功构建并验证了列线图预测模型,为肺腺癌患者的生存预测提供了一个简便可靠的工具。同时,预测模型构建的风险分层模型可以便捷地筛选不同风险的患者,对肺腺癌患者的个体化治疗具有重要的意义。
关键词: SEER数据库    肺腺癌    列线图    预后模型    
Construction and Validation of A Nomogram Prognostic Model for Patients with Lung Adenocarcinoma
LUO Wenqing1 , LI Yuanqi2 , YE Fei1 , LI Qiangming1 , ZHANG Guoqing1 , LI Xiangnan1     
1. Department of Thoracic Surgery, First Affiliated Hospital of Zhengzhou University, Zhengzhou 450052, China;
2. Xiangya School of Public Health, Central South University, Changsha 410012, China
Abstract: Objective To construct a nomogram prognostic model for predicting the survival of patients with lung adenocarcinoma based on the large sample data from the SEER database. Methods We retrospectively analyzed the clinical data of patients who were diagnosed with lung adenocarcinoma from 2010 to 2015 in the SEER database. A nomogram model was created based on independent parameters influencing the prognosis of patients with lung adenocarcinoma using Lasso Cox regression analysis. The C-index and calibration curve were utilized to assess the ability to distinguish and calibrate the nomogram. NRI and DCA curves were used to evaluate the prediction ability and net benefit of the nomogram. Results A total of 15 independent risk factors affecting the prognosis of lung adenocarcinoma were identified and integrated into the nomogram model. The C-index of the prediction model was 0.819 in the training cohort and 0.810 in the validation cohort. The predicted specific survival rate of the 1-, 3- and 5-year calibration curves of the training cohort and the validation cohort were consistent with the actual specific survival rate. In comparison to the 7th edition of the AJCC TNM staging system, the NRI and DCA curves demonstrated a considerable boost to the predictive capacity and net benefits achieved by the nomogram model. The risk stratification model constructed with this nomogram model was able to distinguish the patients with different risks well (P < 0.0001). Conclusion A nomogram prognostic model is successfully developed and validated, which provides a simple and reliable tool for the survival prediction of the patients with lung adenocarcinoma. Meanwhile, the risk stratification model constructed by the prediction model can conveniently screen patients with different risks, which is important for the individualized treatment of lung adenocarcinoma patients.
Key words: SEER database    Lung adenocarcinoma    Nomogram    Prognostic model    
0 引言

肺癌是世界上常见的恶性肿瘤,发病率和死亡率分别位居世界第二和第一[1]。肺癌的两种主要类型是小细胞肺癌和非小细胞肺癌,分别约占所有病例的15%和85%[2]。肺腺癌是非小细胞肺癌的主要组织学亚型,近年来,肺腺癌的发病率增长明显快于肺鳞癌,约占肺癌发病率的40%[3]。由于肺腺癌在早期容易发生转移,并且在确诊时三分之二的肺腺癌患者已经处于晚期(ⅢB/Ⅳ期),因此肺腺癌患者的预后较差,平均5年生存率不足20%[4]。尽管目前肺腺癌在免疫治疗和靶向治疗上研究进展迅速,但5年生存率仍然相对较低[5]。列线图是一种通过给出特定临床事件概率的数值估计,同时结合肿瘤学结果的关键因素来直观评估风险的可靠工具[6]。而且,列线图比传统的TNM分期标准具有更精确的生存预测能力[7]。本研究旨在基于SEER数据库[8],通过大数据队列构建肺腺癌患者生存预后的列线图预测模型。

1 资料与方法 1.1 一般资料

回顾性收集SEER数据库中2010年至2015年诊断为肺腺癌患者的临床数据。按照第7版美国癌症联合委员会(American Joint Committee on Cancer,AJCC)标准对TNM分期进行分类。

1.2 纳入标准与排除标准

纳入标准:(1)患者在2010—2015年间明确诊断;(2)组织学类型(ICD-O-3)为腺癌;(3)经过明确病理学确诊;(4)所有患者均只有一种原发性肿瘤;(5)死因限定为肺癌;(6)随访信息完整。排除标准:(1)组织学类型(ICD-O-3)为非腺癌者;(2)有多种原发性肿瘤;(3)临床资料缺失;(4)治疗信息和随访信息缺失;(5)年龄 < 18岁;(6)生存时间小于1月或未知。

1.3 危险因素的选择

淋巴结阳性比率(lymph node ratio, LNR)是指阳性淋巴结数与总淋巴结数之比。有学者发现,LNR会影响非小细胞肺癌患者的生存预后[9],因此本研究纳入LNR。最终确定的分析变量为:年龄、种族、性别、婚姻状况、肿瘤原发部位、肿瘤分级、肺叶分侧、肿瘤分期、T分期、N分期、M分期、手术、放疗、化疗、LNR、骨转移、脑转移、肝转移、肺转移、肿瘤大小。

1.4 统计学方法

随机将70%的患者分为建模组,30%的患者分为验证组。建模组使用Lasso Cox回归分析筛选出独立危险因素,确定每个独立危险因素的风险比(hazard ratio, HR),并计算相关95%置信区间(95%CI)。

利用筛选出的独立危险因素作为变量,建立一个预测肺腺癌患者1、3和5年特异生存率的列线图模型,并进行内部验证。通过C指数(C-index)和校准曲线对列线图的判别和校准能力进行评估,使用NRI(net reclassification index, NRI)和DCA曲线(decision curve analysis, DCA)对列线图的预测能力和净收益进行评估。为了缩小偏差,上述分析均经过Bootstrap重复进行1 000次。

根据预测模型计算每例患者的总风险得分,并按照总风险得分的四分位数对建模组患者进行分层。采用Kaplan-Meier法和Log rank检验对各风险组生存差异进行显著性评价。使用R4.0.3软件和SPSS25软件进行数据分析。P < 0.05为差异有统计学意义。

2 结果 2.1 建模组和验证组的特征

根据纳入和排除标准,在SEER数据库中确定了16 558例肺腺癌患者(建模组11 592例,验证组4 966例)。患者特征见表 1

表 1 建模组和验证组患者的特征(n(%)) Table 1 Characteristics of patients in training cohort and validation cohort (n(%))
2.2 Lasso回归分析筛选建模组变量情况

经过Lasso回归分析20个可能影响肺腺癌患者预后的变量,最终筛选出15个与预后密切相关的变量,即年龄、种族、性别、婚姻状况、肿瘤分级、肿瘤分期、T分期、N分期、手术、化疗、LNR、骨转移、脑转移、肝转移、肿瘤大小。

2.3 建模组的单因素和多因素Cox回归情况

单因素Cox回归分析显示,Lasso回归分析筛选的15个变量均与特异性生存率显著相关。多因素分析显示,15个变量均是独立的生存预后影响因素,见表 2

表 2 建模组单因素和多因素Cox回归分析 Table 2 Univariate and multivariate Cox regression analyses of training cohort
2.4 肺腺癌患者列线图预后模型的构建与评估

根据上述筛选出的独立预后因素,构建预测肺腺癌患者生存概率的预测模型,见图 1。预测模型判别力检验结果显示出了良好的预后准确性和临床适用性,建模组的C指数为0.819,验证组的C指数为0.810。预测模型建模组的1、3和5年特异性生存率有较高的AUC(area under ROC curve, AUC),分别为0.846、0.869和0.875,验证组的AUC分别为0.838、0.866和0.865。预测模型校准度评估结果显示,建模组和验证组校准曲线预测的1、3和5年特异性生存率与实际特异性生存率吻合较好,见图 2

图 1 预测模型的列线图 Figure 1 Nomogram of prediction model

图 2 建模组(A)和验证组(B)1、3和5年特异性生存率的校准曲线 Figure 2 Calibration curves of 1-, 3- and 5-year specific survival in training cohort(A) and validation cohort(B)
2.5 预测模型与第7版AJCC TNM分期系统的比较

根据第7版AJCC TNM分期系统,构建了预测肺腺癌患者生存概率的预测模型,见图 3。NRI评估发现,本研究构建的预测模型比第7版AJCC TNM分期系统有更强的预测能力,见表 3。DCA分析表明,该预测模型比第7版AJCC TNM分期系统有更高的净收益和临床有效性,见图 4

图 3 TNM分期系统的列线图 Figure 3 Nomogram of TNM staging system

表 3 预测模型的NRI Table 3 NRI of prediction model

图 4 建模组(A~C)和验证组(D~F)预测模型(黑色虚线)和TNM分期系统(红色虚线)分别预测1、3和5年死亡率的决策曲线分析 Figure 4 Decision curve analysis of prediction model (black dashed line) and TNM staging system(red dashed line) predicting 1-, 3- and 5-years mortality in training cohort (A-C)and validation cohort (D-F)
2.6 风险分层模型的构建和检验

在建模组中,本研究以总风险得分的四分位数为截断值,将建模组的11 592例患者分为低风险组(0~138分)、中风险组(139~154分)、中高风险组(155~199分)和高风险组(≥200分)。Kaplan-Meier生存分析表明,四组特异性生存率有显著差异(P < 0.001),见图 5A。在验证组使用该截断值,依然能有效区分不同风险组患者的预后(P < 0.001),见图 5B

图 5 建模组(A)和验证组(B)中应用Kaplan-Meier生存分析法构建的风险分层系统 Figure 5 Risk stratification system constructed by Kaplan-Meier survival analysis in training cohort(A) and validation cohort(B)
3 讨论

近年来,腺癌在非小细胞肺癌中占比越来越高,并且已经超过鳞癌成为最常见的肺癌组织学类型[10]。肺腺癌患者早期一般无明显症状,容易发生转移,侵犯神经、淋巴管和血管等,因此肺腺癌患者的预后较差[11]。准确识别影响肺腺癌预后的独立因素对于个体化治疗的选择具有重要的临床指导意义。与传统的TNM分期相比,列线图更加直观简便,有利于临床医生安排个体化治疗和应对患者咨询。因此,本研究的目的是通过分析肺腺癌患者预后相关因素,构建并验证列线图预后模型。

目前,Lasso回归分析已经广泛应用于Cox回归模型中变量的筛选和预后模型的构建[12-13]。因此,本研究采用Lasso回归分析初步筛选影响肺腺癌生存预后的因素,其优点是可以同时分析所有的变量,避免过度拟合,减少共线性的影响。Lasso Cox回归分析发现,年龄、种族、性别、婚姻状况、肿瘤分级、肿瘤分期、T分期、N分期、手术、化疗、LNR、骨转移、脑转移、肝转移和肿瘤大小是肺腺癌的独立预后因素,与以往研究的结果一致。

此前有报道称,肺腺癌患者的预后与年龄有关,且年龄越大,生存期越短[14]。心脑血管疾病并发症和肝肾功能差可能是老年患者预后差于年轻患者的原因。已有研究发现,不同种族的肺癌患者有不同的生存预后[15]。Zhou等[16]发现,除了原发性肺癌,41.78%的患者死亡是由其他原因引起的,而种族是其中一个竞争性危险因素。Pitz等[17]研究发现,男性肺腺癌患者的生存率远低于女性患者。女性肺腺癌患者的预后优于男性,这可能与女性EGFR突变率高、对于治疗的敏感度高有关。Varlotto等[18]发现,未婚肺腺癌患者的预后比已婚的预后差。这可能与已婚患者可以和伴侣共担风险、获得伴侣足够的情感支持和经济支持有关。

肿瘤分级代表了肿瘤的分化程度,影响肺腺癌患者的生存和预后。有学者认为,肿瘤分级低是导致肺腺癌患者不良预后的一个重要原因[19]。有研究表明,TNM分期会影响肺腺癌患者的预后,且TNM分期越早,患者生存期越长,这与我们的结果一致[20-21]。外科手术通常被认为是治疗肺癌的最佳选择。有学者认为,手术治疗是影响肺腺癌患者预后的独立因素,而且手术患者的生存率比非手术患者的生存率高[22]。Shi等[23]发现,化疗能明显延长肺腺癌患者的生存期,是影响肺腺癌患者生存预后的一个重要的保护因素。Shin等认为,LNR越高的非小细胞肺癌患者,预后往往越差[9]。LNR与肺癌的病理类型有关,肺腺癌更容易发生淋巴结转移,这可能使肺癌复发风险增加,从而影响患者的预后。研究表明,有骨转移、脑转移或肝转移的肺癌患者生存期普遍短于没有器官转移的肺癌患者[14, 23]。患者发生器官转移多提示肿瘤侵袭性较强,TNM分期较晚,预后比较差。研究发现,肿瘤直径越大,肺腺癌患者的生存期越短,这表明肿瘤大小会影响肺腺癌预后[15, 24]

本研究有以下优点:首先,基于SEER数据库应用大样本量肺腺癌患者临床数据;其次,C指数表明预测模型判别准确性较高,校准曲线表明预测模型的预测值与真实值具有很好的一致性。NRI指数和DCA曲线表明,模型的预测能力和获得的净收益优于第7版AJCC TNM分期系统;最后,预测模型可以根据评分系统把患者分为不同的风险亚组,用于预测肺腺癌患者的个体化生存。

本研究同时也有一些局限性:首先,没有对预测模型进行外部队列的验证,只进行了内部队列的验证;其次,SEER数据库缺乏一些重要的变量,如吸烟史、肿瘤标志物、靶向治疗等,这些变量可能会影响肺腺癌患者的预后;最后,回顾性研究结果可能有固有的偏倚和误差。

综上,我们通过Lasso回归分析筛选出影响肺腺癌患者预后的变量,Lasso回归分析中不要求变量符合正态分布,减少共线性的影响,避免了过度拟合。使用Cox比例风险回归分析得到独立预后因素,建立并验证了列线图预测模型,为肺腺癌患者的生存预测提供了一个简便可靠的工具。同时,预测模型构建的风险分层模型可以便捷地筛选出不同风险的患者,这对肺腺癌患者的个体化治疗具有重要意义。

作者贡献:

罗文卿:资料收集、文献查阅、数据分析及论文撰写

李源奇、叶飞:文献查阅、资料收集

李强明、张国庆:研究方案设计、审阅

李向楠:论文修改

参考文献
[1]
Sung H, Ferlay J, Siegel RL, et al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. DOI:10.3322/caac.21660
[2]
Avelino CUR, Cardoso RM, de Aguiar SS, et al. Assessment of quality of life in patients with advanced non-small cell lung carcinoma treated with a combination of carboplatin and paclitaxel[J]. J Bras Pneumol, 2015, 41(2): 133-142. DOI:10.1590/S1806-37132015000004367
[3]
Shi J, Hua X, Zhu B, et al. Somatic Genomics and Clinical Features of Lung Adenocarcinoma: A Retrospective Study[J]. PLoS Med, 2016, 13(12): e1002162. DOI:10.1371/journal.pmed.1002162
[4]
Lin JJ, Cardarella S, Lydon CA, et al. Five-Year Survival in EGFR-Mutant Metastatic Lung Adenocarcinoma Treated with EGFR-TKIs[J]. J Thorac Oncol, 2016, 11(4): 556-565. DOI:10.1016/j.jtho.2015.12.103
[5]
Qi L, Li Y, Qin Y, et al. An individualised signature for predicting response with concordant survival benefit for lung adenocarcinoma patients receiving platinum-based chemotherapy[J]. Br J Cancer, 2016, 115(12): 1513-1519. DOI:10.1038/bjc.2016.370
[6]
Zhang Y, Zheng D, Xie J, et al. Development and Validation of Web-Based Nomograms to Precisely Predict Conditional Risk of Site-Specific Recurrence for Patients With Completely Resected Non-small Cell Lung Cancer: A Multiinstitutional Study[J]. Chest, 2018, 154(3): 501-511. DOI:10.1016/j.chest.2018.04.040
[7]
Wo Y, Yang H, Zhang Y, et al. Development and External Validation of a Nomogram for Predicting Survival in Patients With Stage IA Non-small Cell Lung Cancer ≤2 cm Undergoing Sublobectomy[J]. Front Oncol, 2019, 9: 1385. DOI:10.3389/fonc.2019.01385
[8]
Duggan MA, Anderson WF, Altekruse S, et al. The Surveillance, Epidemiology, and End Results (SEER) Program and Pathology: Toward Strengthening the Critical Relationship[J]. Am J Surg Pathol, 2016, 40(12): e94-e102. DOI:10.1097/PAS.0000000000000749
[9]
Shin S, Kang D, Cho JH, et al. Prognostic impact of lymph node ratio in patients with pT1-2N1M0 non-small cell lung cancer[J]. J Thorac Dis, 2020, 12(10): 5552-5560. DOI:10.21037/jtd-20-1611
[10]
Nakamura H, Saji H. Worldwide trend of increasing primary adenocarcinoma of the lung[J]. Surg Today, 2014, 44(6): 1004-1012. DOI:10.1007/s00595-013-0636-z
[11]
王高祥, 熊燃, 吴汉然, 等. 中性粒细胞/淋巴细胞比值预测根治性切除肺腺癌患者预后分析[J]. 中国肺癌杂志, 2018, 21(8): 588-593. [Wang GX, Xiong R, Wu HR, et al. Prognostic Value of Neutrophil-to-lymphocyte Ratio in Patients with Lung Adenocarcinoma Treated with Radical Dissection[J]. Zhongguo Fei Ai Za Zhi, 2018, 21(8): 588-593.]
[12]
Liao F, Guo X, Lu X, et al. A validated survival nomogram for early-onset diffuse gastric cancer[J]. Aging (Albany NY), 2020, 12(13): 13160-13171.
[13]
Lin JL, Lin JX, Li P, et al. Dynamic prediction of long-term survival in patients with primary gastric diffuse large B-cell lymphoma: a SEER population-based study[J]. BMC Cancer, 2019, 19(1): 873. DOI:10.1186/s12885-019-5993-6
[14]
Campos-Balea B, de Castro Carpeño J, Massutí B, et al. Prognostic factors for survival in patients with metastatic lung adenocarcinoma: An analysis of the SEER database[J]. Thorac Cancer, 2020, 11(11): 3357-3364. DOI:10.1111/1759-7714.13681
[15]
Yang H, Li X, Shi J, et al. A nomogram to predict prognosis in patients undergoing sublobar resection for stageⅠA non-small-cell lung cancer[J]. Cancer Manag Res, 2018, 10: 6611-6626. DOI:10.2147/CMAR.S182458
[16]
Zhou HQ, Zhang YX, Qiu ZT, et al. Nomogram to Predict Cause-Specific Mortality in Patients With Surgically Resected Stage Ⅰ Non-Small-Cell Lung Cancer: A Competing Risk Analysis[J]. Clin Lung Cancer, 2018, 19(2): e195-e203. DOI:10.1016/j.cllc.2017.10.016
[17]
Pitz MW, Musto G, Navaratnam S. Sex as an independent prognostic factor in a population-based non-small cell lung cancer cohort[J]. Can Respir J, 2013, 20(1): 30-34. DOI:10.1155/2013/618691
[18]
Varlotto JM, Voland R, Mckie K, et al. Population-based differences in the outcome and presentation of lung cancer patients based upon racial, histologic, and economic factors in all lung patients and those with metastatic disease[J]. Cancer Med, 2018, 7(14): 1211-1220.
[19]
Zuo Z, Zhang G, Song P, et al. Survival Nomogram for Stage IB Non-Small-Cell Lung Cancer Patients, Based on the SEER Database and an External Validation Cohort[J]. Ann Surg Oncol, 2021, 28(7): 3941-3950. DOI:10.1245/s10434-020-09362-0
[20]
田希贵, 刘德森, 汪元玉, 等. 腺癌与其他类型非小细胞肺癌术后临床特点的差异及预后因素分析[J]. 中国癌症杂志, 2017, 27(3): 227-232. [Tian XG, Liu DS, Wang YY, et al. Postoperative differences in clinical characteristics between adenocarcinoma and other types of non-small cell lung cancer and analysis of prognostic factors of adenocarcinoma treated with surgery[J]. Zhongguo Ai Zheng Za Zhi, 2017, 27(3): 227-232.]
[21]
彭红, 马美丽, 韩宝惠. 1742例Ⅳ期非小细胞肺癌的预后分析[C]. 上海市肺科学会和美国ACCP联合会议论文集, 2011: 142-148. [Peng H, Ma ML, Han BH. Survival analysis of 1742 cases of Ⅳ non-small cell lung cancer[C]. Proceedings of the Joint Conference of the Shanghai Pulmonary Society and ACCP, 2011: 142-148.]
[22]
冯悦. 168例肺腺癌患者预后因素分析[D]. 承德医学院, 2016. [Feng Y. Analysis of prognostic factors in 168 cases of lung adenocarcinoma patients[D]. Chengde Medical College, 2016.]
[23]
Shi M, Zhan C, Shi J, et al. Prediction of Overall Survival of Patients with Completely Resected Non-Small Cell Lung Cancer: Analyses of Preoperative Spirometry, Preoperative Blood Tests, and Other Clinicopathological Data[J]. Cancer Manag Res, 2019, 11: 10487-10497. DOI:10.2147/CMAR.S232219
[24]
Sun F, Ma K, Yang X, et al. A nomogram to predict prognosis after surgery in early stage non-small cell lung cancer in elderly patients[J]. Int J Surg, 2017, 42: 11-16. DOI:10.1016/j.ijsu.2017.04.024