大肠癌是我国常见恶性肿瘤之一,近20年来其发病率和死亡率均呈明显上升趋势[ 1,2 ]。目前认为,大肠癌大多由腺瘤性息肉发展而来,70%~75%新诊断的大肠癌患者来自于50岁以上的无症状平均风险人群[ 3 ]。所谓无症状平均风险人群,是指无大肠癌相关症状或预警症状、无大肠癌和大肠腺瘤性息肉病史及家族史、无遗传性大肠癌和炎症性肠病病史的人群[ 3 ]。对无症状平均风险人群进行结肠镜筛查,可以发现早期大肠癌和癌前病变并进行及时治疗,所以,可望有效降低该人群大肠癌的发病率和死亡率[ 4 ]。然而,与粪隐血试验等其他筛查方法相比较,结肠镜检查的费用较高,且属于侵入性检查,所以很多学者质疑其作为平均风险人群首选筛查方法的合理性[ 5 ]。此外,估计我国50岁以上的无症状平均风险人群超过1亿,以目前的卫生资源和经济条件根本无法支持针对全人群的结肠镜筛查策略[ 6 ]。
研究表明,平均风险人群并非等同于低风险人群[ 3,7 ]。如果能够利用一些容易获得的信息,如年龄、性别等,对平均风险人群的患病风险进行准确预测(危险分层),然后针对其中患病风险较高的人群再进行结肠镜筛查,这必将大大提高筛查效能,降低筛查费用,节约卫生资源。本研究拟探讨我国苏南地区汉族无症状平均风险人群大肠进展期肿瘤发生风险的最佳预测因子,在此基础上建立该人群大肠进展期肿瘤发生风险评分系统,并进行评价。
1 资料和方法 1.1 研究对象为2011年7月到2012年12月在江苏大学附属宜兴医院进行常规健康体检时,接受结肠镜检查的苏南地区籍(包括江苏省苏州、无锡、常熟和浙江长兴地区)无症状平均风险人群。纳入标准:拟行结肠镜检查;年龄≥40岁;汉族;无症状或仅有大肠非特异症状(轻微腹痛、间歇腹泻或便秘)的体检人群。排除标准:(1)一、二级亲属有大肠肿瘤史;(2)60岁以下一级亲属中有腺瘤性息肉病史或家族遗传性综合征(包括家族性腺瘤性息肉病、遗传性非息肉性大肠癌、Turcot综合征、Oldfield综合征等);(3)有大肠癌或息肉病、炎症性肠病、其他器官肿瘤等病史;(4)有缺铁性贫血或粪便隐血试验阳性、便血、体重明显减轻、里急后重等症状;(5)近5年有结肠镜检查史;(6)有大肠手术史。
1.2 研究设计和资料采集采用横断面研究设计,通过问卷调查和结肠镜检查采集资料。问卷调查在结肠镜检查前实施,调查内容包括人口学特征、既往疾病史、手术史、服药史、吸烟史、饮酒史、饮茶史、体力活动情况、饮食习惯、排便频率等。吸烟是指平均每天至少吸1支烟,持续1年及以上。饮酒定义为每周至少喝一次酒,持续1年及以上。饮茶是指每周至少泡2次茶(1次茶叶反复冲泡直至丢弃定义为泡1次茶;如若在1次茶的基础上添加茶叶进行冲泡,则定义为2次茶,依次类推),持续3个月及以上。饮食习惯采用半定量食物量表进行调查。每周少于3次的摄入,定义为“偶尔摄入”。每周至少3次的摄入,定义为“经常摄入”。
结肠镜检查由经验丰富的2名消化内镜专家进行,并负责填写检查结果。大肠进展期肿瘤包括进展期腺瘤和浸润癌。进展期腺瘤包括直径≥1 cm的腺瘤、绒毛状腺瘤(至少有25%的绒毛成分)、伴有重度不典型增生的管状腺瘤。浸润癌是指恶性细胞浸润超过黏膜肌层的肿瘤。重度不典型增生包括黏膜内癌和原位癌。只有肠道准备良好、完成全结肠检查(结肠镜到达回盲瓣)的研究对象才被纳入统计学分析。
1.3 统计学处理应用EpiData 3.02软件,通过双录入核查方式建立数据库。应用SPSS 19.0软件对数据进行统计分析。所有分析均为双侧检验。多因素分析的检验水准为0.05。
1.3.1 大肠进展期肿瘤发生风险预测模型及其评分系统的建立与评价以结肠镜检查结果(进展期肿瘤有或无)作为应变量,以人口学特征等其他变量作为自变量,进行单因素分析和多因素分析。根据自变量的数据性质,分别采用两组资料t检验、Mann-Whitney U检验、χ2检验等方法进行单因素分析。选择单因素分析结果中P<0.20的自变量作为潜在的进展期肿瘤预测变量[ 6 ],同时引入自变量的平方项和交互作用项,分别采用前进法、后退法和逐步法多元logistic回归分析方法筛选自变量,依据统计和专业知识确定其中一个筛选结果,建立大肠进展期肿瘤发生风险预测模型。为了便于临床应用,将上述模型中的连续性变量转换成分类变量后重新进行多元logistic回归分析,根据新logistic回归模型中各变量的β值赋予分值[ 6,8 ],建立大肠进展期肿瘤发生风险评分系统。风险预测的一致性评价采用Hosmer-Lemeshow拟合优度检验方法[ 6 ]。风险预测模型及其评分系统的区分能力通过受试者工作特性曲线(ROC曲线)下面积进行评价[ 6, 8, 9 ]。准确度采用敏感度、特异度、准确率、阳性预测值、阴性预测值、阳性似然比、阴性似然比[ 6 ]进行评价。
1.3.2 大肠进展期肿瘤发生风险评分系统的内部人群验证采用非参数Bootstrap方法进行验证[ 6,10 ]。具体方法:在原始数据的范围内做同样样本含量的有放回抽样,所得样本称为Bootstrap样本,由这样的样本进行评分系统的ROC曲线分析,可得到一个ROC曲线下面积的估计值;重复抽取这样的样本1 000次,可得到1 000个评分系统的ROC曲线下面积估计值;根据正态分布原理,计算评分系统ROC曲线下面积的点估计及其95%可信区间。
1.3.3 与其他类似评分系统的比较已报道的类似评分系统包括Cai等[ 6 ]、Betés等[ 11 ]和Lin等[ 12 ]建立的评分系统。分别计算上述3个评分系统在本研究人群中的ROC曲线下面积及其95%可信区间。采用Mann-Whitney U检验方法比较本研究所建立的评分系统与上述3个评分系统ROC曲线下面积的差异性。
2 结 果 2.1 研究对象特征共纳入985例研究对象,其中905例(91.9%)完成了全结肠检查,被纳入后续统计分析。905例研究对象中,男性393例(43.4%),女性512例(56.6%);平均年龄(56.6±10.1)岁;大肠进展期肿瘤48例(5.3%),非进展期肿瘤857例(94.7%)。
2.2 大肠进展期肿瘤发生风险预测模型及其评分系统的建立与评价单因素分析结果显示,年龄、性别、受教育程度、高血压、冠心病、吸烟、饮酒、饮茶、绿色蔬菜摄入、蛋类摄入、排便频率是大肠进展期肿瘤发生风险的潜在预测因子(P<0.20,表 1)。多因素分析结果显示,年龄、性别、冠心病、蛋类摄入、排便频率是大肠进展期肿瘤发生风险的独立预测因子(表 1)。Hosmer-Lemeshow拟合优度检验结果显示,logistic回归模型的拟合优度良好(P=0.174)。ROC曲线下面积(95% CI)为0.76 (0.70~0.82)(P<0.001),说明logistic回归模型的区分度良好。
为了便于临床应用,将上述模型中的连续性变量“年龄”转换成分类变量后重新进行多元logistic回归分析(表 2)。Hosmer-Lemeshow拟合优度检验结果显示,新logistic回归模型的拟合优度良好(P=0.205)。ROC曲线下面积(95% CI)为0.76 (0.70~0.82)(P<0.001),说明模型的区分度良好。基于新logistic回归模型建立的大肠进展期肿瘤发生风险评分系统由5个变量组成(年龄、性别、冠心病、蛋类摄入、排便频率),分值范围为0~10分(表 2)。随着分值增高,研究对象中大肠进展期肿瘤患者的比例呈增高趋势(表 3)。评分系统的ROC曲线分析结果显示,ROC曲线下面积(95% CI)为 0.75 (0.69~0.82)(P<0.001),说明其区分度良好。
基于评分系统ROC曲线,以2.5分作为界值,将研究对象划分为大肠进展期肿瘤低风险人群(411
例,45.4%)和高风险人群(494例,54.6%)。高风险人群(>2分)中大肠进展期肿瘤的比例为9.1% (45/494),明显高于低风险人群(0~2分)中大肠进展期肿瘤的比例(0.7%,3/411,P<0.001),见表 3。预测界值下评分系预测大肠进展期肿瘤的敏感度、特异度、准确率、阳性预测值、阴性预测值、阳性似然比、阴性似然比分别为93.8%、47.6%、50.1%、9.1%、99.3%、1.79和0.13。高风险人群中包含了93.8% (45/48)的大肠进展期肿瘤病例。在全人群、低风险人群和高风险人群中,每筛出1例进展期肿瘤需要完成结肠镜检查的例数分别为19例、137例和11例(表 3)。 2.3 大肠进展期肿瘤发生风险评分系统的内部人群验证非参数Bootstrap方法验证结果显示,评分系统的平均ROC曲线下面积(95% CI)为0.75 (0.70~0.82),与建模人群的ROC曲线分析结果相似。
2.4 与其他类似评分系统的比较
在4种评分系统中,本文建立的评分系统的区分度最好,明显优于Cai等[ 6 ]建立的评分系统(P=0.036),但与Betés等[ 11 ]和Lin等[ 12 ]建立的评分系统无明显差别(P>0.05,表 4)。
本研究所建立的大肠进展期肿瘤发生风险评分系统由年龄、性别、冠心病、蛋类摄入、排便频率等5个变量组成,具有良好的预测一致性和区分度,较高的敏感度和阴性预测值,可以应用于无症状平均风险人群大肠进展期肿瘤的初筛。对于被评分系统筛查工具判断为低风险的人群,定期随访或进行粪便隐血试验检查即可;而对于高风险人群,建议进行全结肠检查,以发现潜在的大肠病变。本研究结果有助于建立具有苏南地区特色的大肠癌筛查策略,从而明显提高苏南地区大肠癌筛查的效能,降低筛查费用,节约卫生资源。
本研究所建立的大肠进展期肿瘤发生风险评分系统是有效、准确和可信的,可以作为大肠癌初筛工具,应用于苏南地区无症状平均风险人群的大肠癌筛查。首先,我们的研究结果显示,无论是建模还是内部人群验证,该评分系统均表现出良好的区分度,可以较为准确地区分高风险人群和低风险人群。其次,该评分系统的敏感度高达93.8%,高风险人群包含了大多数大肠进展期肿瘤病例,漏诊率低,且其阴性预测值很高(99.3%),所以,特别适合作为大肠癌的初筛工具应用于人群筛查。第三,与已报道的类似评分系统相比,该评分系统应用于苏南地区人群具有更高的区分度,更适合于苏南地区人群的大肠癌筛查。 第四,我们的研究结果显示,在全人群、低风险人群和高风险人群中,每筛出1例进展期肿瘤需要完成结肠镜检查的例数分别为19例、137例和11例。采用基于本研究结果的危险分层筛查策略,在减少45.4% (411/905)结肠镜检查例数的情况下,可以筛查出93.8% (45/48)的病例,所以,这种策略明显提高了人群筛查效率。第五,我们的研究发现,年老、男性、有冠心病史、经常摄入蛋类食物、排便频率较少(2日或以上一次)是大肠进展期肿瘤的独立危险因素,这与文献报道的结果一致[ 13,14,15,16,17 ]。已有大量研究证实,随着年龄增加,大肠癌的发病风险明显增大,所以国外筛查指南建议从50岁开始对无症状平均风险人群进行大肠癌筛查[ 13 ]。多个不同种族人群的研究结果证实,男性发生大肠进展期肿瘤的风险明显高于女性[ 14 ]。大肠肿瘤患者往往同时伴有冠心病,推测可能与这两种疾病具有共同的危险因素有关[ 15 ]。有研究表明,经常摄入蛋类食物可以增加大肠癌等多种恶性肿瘤的发病风险[ 16 ]。观察性研究结果表明,便秘可能增加大肠癌的发病风险[ 17 ]。
本研究可能存在以下缺陷:(1)由于样本量相对较少(合格研究对象905例,其中进展期肿瘤48例),所以,只能将所有研究对象用于建模。本研究结果还需要在更大的外部人群中进行进一步验证。(2)本研究采用横断面研究设计,很多潜在危险因素的资料来自于研究对象的回忆,可能存在回忆偏倚。尽管存在上述缺陷,我们的验证结果仍然显示这一评分系统是准确、有效和可信的。
4 利益冲突
所有作者声明本文不涉及任何利益冲突。
[1] | 陈万青,郑荣寿,曾红梅,张思维,赵 平,赫 捷.1989-2008年中国恶性肿瘤发病趋势分析[J].中华肿瘤杂志,2012,34:517-524. |
[2] | 任建松,李 倩,关 鹏,代 敏,杨 玲.中国2008年消化道常见恶性肿瘤发病、死亡和患病情况的估计及预测[J].中华流行病学杂志,2012,33:1052-1055. |
[3] | Nelson R S,Thorson A G.Colorectal cancer screening [J].Curr Oncol Rep,2009,11:482-489. |
[4] | Schoenfeld P,Cash B,Flood A,Dobhan R,Eastone J,Coyle W,et al.Colonoscopic screening of average-risk women for colorectal neoplasia [J].N Engl J Med,2005,352:2061-2068. |
[5] | Sung J.Does fecal occult blood test have a place for colorectal cancer screening in China in 2006?[J].Am J Gastroenterol,2006,101:213-215. |
[6] | Cai Q C,Yu E D,Xiao Y,Bai W Y,Chen X,He L P,et al.Derivation and validation of a prediction rule for estimating advanced colorectal neoplasm risk in average-risk Chinese [J].Am J Epidemiol,2012,175:584-593. |
[7] | Lieberman D.Screening for colorectal cancer in average-risk populations [J].Am J Med,2006,119:728-735. |
[8] | Moons K G,Harrell F E,Steyerberg E W.Should scoring rules be based on odds ratios or regression coefficients?[J].J Clin Epidemiol,2002,55:1054-1055. |
[9] | Hanley J A,McNeil B J.The meaning and use of the area under a receiver operating characteristic (ROC) curve [J].Radiology,1982,143:29-36. |
[10] | Steyerberg E W,Bleeker S E,Moll H A,Grobbee D E,Moons K G.Internal and external validation of predictive models:a simulation study of bias and precision in small samples [J].J Clin Epidemiol,2003,56:441-447. |
[11] | Betés M,Muñoz-Navas M A,Duque J M,Angós R,Macías E,Súbtil J C,et al.Use of colonoscopy as a primary screening test for colorectal cancer in average risk people [J].Am J Gastroenterol,2003,98:2648-2654. |
[12] | Lin O S,Kozarek R A,Schembre D B,Ayub K,Gluck M,Cantone N,et al.Risk stratification for colon neoplasia:screening strategies using colonoscopy and computerized tomographic colonography [J].Gastroenterology,2006,131:1011-1019. |
[13] | Rex D K,Johnson D A,Anderson J C,Schoenfeld P S,Burke C A,Inadomi J M.American College of Gastroenterology.American College of Gastroenterology guidelines for colorectal cancer screening 2009 [corrected] [J].Am J Gastroenterol,2009,104:739-750. |
[14] | Nguyen S P,Bent S,Chen Y H,Terdiman J P.Gender as a risk factor for advanced neoplasia and colorectal cancer:a systematic review and meta-analysis [J].Clin Gastroenterol Hepatol,2009,7:676-681. |
[15] | Chan A O,Lam K F,Tong T,Siu D C,Jim M H,Hui W M,et al.Coexistence between colorectal cancer/adenoma and coronary artery disease:results from 1382 patients [J].Aliment Pharmacol Ther,2006,24:535-539. |
[16] | Aune D,De Stefani E,Ronco A L,Boffetta P,Deneo-Pellegrini H,Acosta G,et al.Egg consumption and the risk of cancer:a multisite case-control study in Uruguay [J].Asian Pac J Cancer Prev,2009,10:869-876. |
[17] | Power A M,Talley N J,Ford A C.Association between constipation and colorectal cancer:systematic review and meta-analysis of observational studies [J].Am J Gastroenterol,2013,108:894-903. |