肿瘤防治研究  2023, Vol. 50 Issue (1): 98-102
本刊由国家卫生和计划生育委员会主管,湖北省卫生厅、中国抗癌协会、湖北省肿瘤医院主办。
0

文章信息

深度学习在膀胱癌病理学中的研究进展
Research Progress of Deep Learning in Bladder Cancer Pathology
肿瘤防治研究, 2023, 50(1): 98-102
Cancer Research on Prevention and Treatment, 2023, 50(1): 98-102
http://www.zlfzyj.com/CN/10.3971/j.issn.1000-8578.2023.22.0704
收稿日期: 2022-06-22
修回日期: 2022-07-19
深度学习在膀胱癌病理学中的研究进展
郑庆源 ,    杨瑞 ,    王磊 ,    陈志远 ,    刘修恒     
430060 武汉,武汉大学人民医院泌尿外科
摘要: 膀胱癌的发病率逐年上升,其诊断的金标准依赖于组织病理活检。全载玻片数字化技术可产生大量高分辨率捕获的病理图像,促进了数字病理学的发展。随着人工智能的热潮掀起,深度学习作为人工智能的一种新方法,已经在膀胱癌的肿瘤诊断、分子分型、预测预后和复发等病理图像分析中取得了显著成果。传统病理极度依赖于病理学家的专业水平和经验储备,主观性强且可重复性差。深度学习以其自动提取图像特征的能力,在辅助病理学家进行决策时,可提高诊断效率和可重复性,降低漏诊和误诊率。这不仅能缓解目前面临人才短缺和医疗资源不均的压力,而且也能促进精准医疗的发展。本文就深度学习在膀胱癌病理图像分析中的最新研究进展和前景作一述评。
关键词: 人工智能    深度学习    膀胱癌    病理图像    数字病理学    精准医疗    
Research Progress of Deep Learning in Bladder Cancer Pathology
ZHENG Qingyuan , YANG Rui , WANG Lei , CHEN Zhiyuan , LIU Xiuheng     
Department of Urology, Renmin Hospital of Wuhan University, Wuhan 430060, China
Abstract: The incidence of bladder cancer is increasing annually, and the gold standard for its diagnosis relies on histopathological biopsy. Whole-slide digitization technology can produce thousands of high-resolution captured pathological images and has greatly promoted the development of digital pathology. Deep learning, as a new method of artificial intelligence, has achieved remarkable results in the analysis of pathological images for tumor diagnosis, molecular typing, and prediction of prognosis and recurrence of bladder cancer. Traditional pathology relies heavily on the professional level and experience of pathologists; as such, it is highly subjective and has poor reproducibility. Deep learning can automatically extract image features. It can also improve diagnostic efficiency and repeatability and reduce missed and misdiagnosed rates when used to assist pathologists in making decisions. This technology cannot only alleviate the pressure of the current shortage of skilled workforce and uneven medical resources but also promote the development of precision medicine. This article reviews the latest research progress and prospects of deep learning in pathological image analysis of bladder cancer.
Key words: Artificial intelligence    Deep learning    Bladder cancer    Pathological images    Digital pathology    Precision medicine    
0 引言

膀胱癌(bladder cancer, BLCA)是全球十大最常见的癌症之一,是泌尿系统发病率最高的恶性肿瘤[1]。据最新公布的全球癌症数据(GLOBOCAN 2020)报道,2020年新发病例约有57.3万例,死亡病例约为21.3万例[2]。非肌层浸润性膀胱癌(non-muscular invasive bladder cancer, NMIBC)患者的5年生存率约为90%,但随着肿瘤侵犯膀胱的不同层次,BLCA患者不仅5年生存率急剧下降,对治疗的反应差异也很大[3]。因此,对BLCA的准确识别和诊断有助于后续的个性化治疗,也是实现精准医疗的关键步骤。目前,BLCA的诊断主要由病理学家通过组织活检确定,也以此作为后续治疗的基石[4]。然而,一张病理切片图像所包含的丰富信息并不能完全被病理学家所解读,并且在解读过程中容易受到主观因素的影响。随着人工智能(artificial intelligence, AI)的出现和数字病理学的发展,允许我们使用计算的方法来分析数字化的全切片图像(whole slide imaging, WSI)[5]。本文就深度学习(deep learning, DL)技术在BLCA病理图像处理和分析中的研究进展、局限性和展望作一综述,以期为广大同行及学者提供参考和新的研究思路。

1 DL概述及其在数字病理学中的发展

AI是计算机科学的一个分支,它试图通过开发计算机的智能,以模仿人类的工作和思维方式。机器学习(machine learning, ML)是AI的一个组成部分,它可以从大量数据中手动测量一组事先预定的特征,借以构建模型。DL是ML的一个子类,它通过类似于生物神经系统的结构方式来处理和分析信息,其类型包括卷积神经网络(convolutional neural network, CNN)、循环神经网络和前馈神经网络等。CNN是目前使用最为广泛的DL算法,它受到哺乳动物大脑视觉皮层的启发,在图像处理和分析方面有着强大的能力。通常CNN的架构包括卷积层、池化层和全连接层,通过反向传播算法可以自适应地从输入的图像中不断提取特征,进而聚合形成高阶结构关系,以识别感兴趣的区域[6]

随着近几年DL的兴起,数字病理学得到了迅猛发展。病理学中的AI模型已经从最初始的人工模式发展到传统的ML,然后发展到DL[7]。人工模式依赖于病理学家定义的规则,传统ML需要根据病理学家的先验知识定义特征,而DL可以直接从原始数据中学习相关特征来训练高性能模型。相比于传统的病理图像识别技术,DL方法具有较高的准确性并且更容易在临床实践中应用,有着明显的优势。目前DL已被应用于各种病理图像处理和分类,包括疾病诊断[8]、检测[9]、分割[10]、预测预后[11]和复发[12]等。这些研究表明借助DL技术可能有助于克服病理学家主观视觉评估的局限性,并且缓解病理学家资源相对匮乏的局面[13]

2 DL在BLCA病理诊断中的应用

早期NMIBC患者的5年生存率可达90%左右。然而,当疾病进展到肌层浸润性膀胱癌(muscle-invasive bladder cancer, MIBC)时,生存率急剧下降。降低BLCA的死亡率,早期发现和适当治疗至关重要,而精准高效的病理识别和诊断是实现这一目标的关键。目前,传统上病理诊断主要依靠病理学家手动完成。这种传统工作模式存在难度高、主观性强、可重复性差和耗时繁琐等缺点,已然成为日常实践中较为突出的矛盾点,需要进行优化和改善。因此,越来越多的研究通过DL技术开发简单方便且可靠的方法,以辅助病理学家进行疾病的诊断和识别。

Noorbakhsh等[14]使用DL技术对19种癌症的WSI进行了肿瘤识别、亚型和突变分类。他们的数据集是来自TCGA数据库的27 815张HE染色的WSI图像。结果显示,DL模型对BLCA分类的准确率高达98%以上,并且在大多数癌症类型上进行训练的分类器也可以成功识别BLCA,工作特征曲线下面积(AUC)为98%。Jansen等[15]基于DL技术训练了一个U-Net分割神经网络用于自动检测尿路上皮和一个分类神经网络用于对NMIBC的准确分级。他们从三个不同中心纳入了232例NMIBC患者,共获取了328份肿瘤标本,并对其进行HE染色后数字化扫描成WSI。结果表明,通过结合U-Net分割网络和分类网络,可以实现对NMIBC的自动检测和分级,其准确度与病理学家相当。

3 DL在BLCA分子分型中的应用

BLCA根据肿瘤侵犯膀胱的不同层次,分为NMIBC和MIBC。目前,MIBC已经确定了不同的分子亚型,包括管腔样、基底样和神经元样[16]。由于不同亚型的MIBC对治疗方法有不同的反应,且与预后相关,因此准确识别MIBC的不同亚型在疾病的诊疗中非常重要。但是目前临床上现有的分子亚型分层方法往往耗时长,且经济成本高,限制了MIBC分子亚型在临床中的应用。DL技术在医学领域的迅速发展或可解决此问题。

Woerl等[17]利用DL技术从苏木精和伊红(HE)载玻片中预测MIBC患者的分子亚型(基底样、管腔样、P53样以及全阴性型),并将预测结果与病理学专家的诊断结果进行了比较。他们从癌症基因组图谱(TCGA)数据库中收集了363张WSI作为训练集,使用5折交叉验证的策略训练模型,并在独立队列中进行了验证。结果显示,DL模型在验证集的平均准确率高达70%,比病理学家的判读结果更加准确。因此,该研究还利用类激活图可视化技术进一步分析了DL模型对于不同分子亚型肿瘤的感兴趣区域,以研究与每种分子亚型最相关的病理学特征。结果表明,DL模型对于全阴性型肿瘤所关注的病理学特征大多数为具有致密和深染的细胞核;基底样肿瘤往往具有多形性的细胞核和多个核仁;管腔样肿瘤常为乳头状生长;而p53样肿瘤则表现为具有弥漫性浸润的单个肿瘤细胞和一些促纤维间质。由此可见,DL模型的可视化技术可以帮助我们更好地理解神经网络的关注区域是否符合现有的病理学知识,并可能提供之前从未被评估过的病理学特征,也进一步增加了模型的透明度和可信度。

Khosravi等[18]利用DL技术有效地对四种类型癌症的组织病理学图像进行了分类,其中包括BLCA。他们收集了来自斯坦福组织微阵列数据库和TCGA数据库的组织病理学图像,证明DL方法在区分不同癌症组织、亚型、免疫组织化学标记及其表达评分方面的强大能力。

4 DL在BLCA复发中的应用

尽管NMBIC患者的五年生存率高达90%,但疾病复发率较高。准确预测NMIBC的复发和进展是管理患者的关键。目前对具有较高复发和进展风险的患者,可以采用欧洲癌症研究和治疗组织(EORTC)[19]、西班牙泌尿肿瘤俱乐部(CUETO)[20]和欧洲泌尿外科协会(EAU)开发的分层工具进行评估。然而,有研究表明,EAU、EORTC和CUETO风险分层量表在预测BLCA的复发和进展方面仅表现出中等表现[21]。其中,EORTC和CUETO对复发的判别能力较低,高估了高危患者的复发风险[22-23]。此外,在这两个分层工具中都使用了肿瘤的组织病理学特征,这些特征容易受观察者之间高度变异的影响[24]。DL技术可以自动提取病理图像中潜在的生物学或病理组织学的特征,而不依靠传统的肿瘤分期和分级的信息,或许可以消除病理学家在阅片中所带来的主观差异。

Lucas等[25]将WSI与临床数据相结合,使用DL预测了NMIBC患者的1年和5年无复发生存率。他们在359例患者的1年随访研究队列和281例患者的5年随访研究队列中进行了探索。结果证明,相比于仅使用临床数据(AUC为57%)或图像数据(AUC为72%)的模型,他们的模型增强了对NMIBC患者5年内复发的预测,AUC为76%。

5 DL在BLCA突变基因检测的应用

在临床诊疗中,尽管属于同一种病理亚型的BLCA,在分子水平上也可能存在差异,对治疗的反应也各不相同。其中,成纤维细胞生长因子受体(FGFR)抑制剂已被美国食品药品监督管理局批准用于MIBC的靶向治疗,但前提是需要有明确的分子检测。然而,分子检测并不是所有医院可具备的条件,同时也会加重患者的经济负担。最近有研究报道,DL技术可以通过WSI初步预测基因的突变情况[26]。这类方法拥有简单、快速、可靠和廉价的优点,可以很好地在临床实践中实现对肿瘤分子水平初步检测的应用。

Loeffler等[27]基于DL技术直接从WSI中检测了BLCA患者的FGFR3基因的突变情况。他们所使用的数据集是来自TCGA数据库的237例MIBC患者和来自独立队列的182例BLCA患者,收集这些患者的WSI和相应的遗传信息,结果表明,TCGA队列和独立外部队列中DL模型均能从WSI中准确预测出FGFR3的突变情况,AUC分别为0.701和0.725,优于泌尿病理学家。通过DL对BLCA患者的FGFR3突变进行简便的预筛查,有益于患者的早期检测和个性化治疗。

6 DL在BLCA尿液细胞病理图像中的应用

尿液细胞学检查是被广泛用于检测高级别尿路上皮癌(high-grade urothelial carcinoma, HGUC)的一项检查,其诊断标准是由巴黎第18届国际细胞学大会提出的巴黎尿液细胞学报告系统。在临床实践中,病理学家会在显微镜下手动扫描样本,通过检测HGUC细胞以做出最终诊断。然而,在尿液细胞学检查的病理诊断中同样存在观察者间变异的情况。随着数字病理的发展,这些尿液细胞学检查的病理载玻片可以进行巴氏染色后数字化扫描成WSI。目前,DL技术在BLCA尿液细胞病理图像中的研究也越来越多。在尿液细胞学检查期间,通过借助DL技术进行病理图像的识别和筛查,既可以提高日常工作效率以及降低漏诊和误诊率,也可以帮助泌尿外科医生制定后续的治疗策略。

Nojima等[28]从232例HGUC患者的巴氏染色尿细胞病理图像中开发了一个DL模型,用于筛查HGUC细胞。在良恶性病例的识别中,他们所训练的模型取得了出色的性能,AUC为0.989。此外,DL模型还可以进一步判断肿瘤是否具有侵袭性。通过可视化技术发现,DL模型进行核分级的诊断是基于HGUC的细胞核。在诊断基质侵袭中,细胞核的特点包括有皱缩的细胞核、颜色不规则和中性粒细胞浸润。在诊断核分级中,细胞核的特点为染色密集或核仁明显的粗染色质。此外结果表明,细胞核的大小似乎对模型的诊断没有贡献,且手动复测时也没有发现明显的差异。

Sanghvi等[29]基于2 405张存档的HGUC尿细胞学载玻片开发了一种能够准确分析尿细胞学病理图像的DL模型。结果证明,该DL模型可以通过缩短筛查WSI所需的时间来提高病理学家的工作效率,并且还可以提高诊断准确性,AUC为0.88。

Awan等[30]基于DL方法提出了一种用于识别HGUC尿细胞病理图像中非典型细胞和恶性细胞的方法。他们首先采用细胞分割和分类的方法,对非典型细胞和恶性细胞进行了识别,以计算出非典型细胞和恶性细胞个数在所有细胞中的占比。紧接着根据占比结果作为预测预后的因子,对HGUC患者进行风险分层。该研究纳入了398例患者的398张HE染色切片后对其进行分析,以自动预测每例患者的风险程度。结果表明,DL模型识别非典型细胞和恶性细胞的性能出色,AUC为0.99。通过对非典型和恶性细胞的计数作为预后因子,可以对HGUC患者进行较为准确的风险分层。

7 结语

综上所述,AI中的DL技术在BLCA的病理诊断、疾病复发与进展和突变基因检测等方面展现出了良好的性能和较好的应用潜力。在一些研究中,DL算法所展现出的能力甚至可以与病理学家媲美。然而,DL的发展时间较为短暂,在病理学中的应用也仅处于起步阶段,仍然存在一些局限性和挑战:(1)数据集标准化问题。来自不同病理科的病理切片在样本采集、制作、染色和数字化扫描上存在着差异,这些异质性均可能会影响到DL模型的稳健性;(2)模型可解释性差。DL模型由于其推理过程中缺乏可解释性,往往会破坏结果的可信度并限制其实际应用;(3)可用数据集匮乏。训练一个可靠的DL模型往往需要强大的数据集,然而由于医学伦理要求严格保护好患者的隐私,许多数据不得被公开使用,因此难以获得足够多的数据支撑模型的精度。针对以上存在的挑战,未来可在以下方面进行解决:(1)建立起国内外统一的病理图像标准化制作程序和大型病理数据库;(2)开展前瞻性实验纳入多中心数据以确保模型的泛化性和稳健性;(3)进一步开发可解释、可通用的下一代人工智能方法,提高模型的透明度,打破现有深度学习“黑箱算法”的现状。尽管存在上述的局限性和挑战,但基于AI的DL方法在数字病理学方面的应用仍有可观的前景。随着科学的不断发展和进步,病理学家与AI的合作不仅可以提高诊断效能,而且也有助于辅助临床决策的制定,最终将会促进BLCA的精准诊疗,让更多的患者获益。

作者贡献:

郑庆源:论文撰写与修改

杨瑞:论文修改

王磊、陈志远、刘修恒:论文审校

参考文献
[1]
Siegel RL, Miller KD, Fuchs HE, et al. Cancer Statistics, 2022[J]. CA Cancer J Clin, 2022, 72(1): 7-33. DOI:10.3322/caac.21708
[2]
Sung H, Ferlay J, Siegel RL, et al. Global Cancer Statistics 2020:GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. DOI:10.3322/caac.21660
[3]
Patel VG, Oh WK, Galsky MD. Treatment of muscle-invasive and advanced bladder cancer in 2020[J]. CA Cancer J Clin, 2020, 70(5): 404-423. DOI:10.3322/caac.21631
[4]
Witjes JA, Bruins HM, Cathomas R, et al. European Association of Urology Guidelines on Muscle-invasive and Metastatic Bladder Cancer: Summary of the 2020 Guidelines[J]. Eur Urol, 2021, 79(1): 82-104. DOI:10.1016/j.eururo.2020.03.055
[5]
Nawaz S, Yuan Y. Computational pathology: Exploring the spatial dimension of tumor ecology[J]. Cancer Lett, 2016, 380(1): 296-303. DOI:10.1016/j.canlet.2015.11.018
[6]
Hamet P, Tremblay J. Artificial intelligence in medicine[J]. Metabolism, 2017, 69S: S36-S40.
[7]
Bera K, Schalper KA, Rimm DL, et al. Artificial intelligence in digital pathology-new tools for diagnosis and precision oncology[J]. Nat Rev Clin Oncol, 2019, 16(11): 703-715. DOI:10.1038/s41571-019-0252-y
[8]
Foersch S, Eckstein M, Wagner DC, et al. Deep learning for diagnosis and survival prediction in soft tissue sarcoma[J]. Ann Oncol, 2021, 32(9): 1178-1187. DOI:10.1016/j.annonc.2021.06.007
[9]
Ehteshami Bejnordi B, Veta M, Johannes van Diest P, et al. Diagnostic Assessment of Deep Learning Algorithms for Detection of Lymph Node Metastases in Women With Breast Cancer[J]. JAMA, 2017, 318(22): 2199-2210. DOI:10.1001/jama.2017.14585
[10]
Hermsen M, de Bel T, den Boer M, et al. Deep Learning-Based Histopathologic Assessment of Kidney Tissue[J]. J Am Soc Nephrol, 2019, 30(10): 1968-1979. DOI:10.1681/ASN.2019020144
[11]
Courtiol P, Maussion C, Moarii M, et al. Deep learning-based classification of mesothelioma improves prediction of patient outcome[J]. Nat Med, 2019, 25(10): 1519-1525. DOI:10.1038/s41591-019-0583-3
[12]
Yang J, Ju J, Guo L, et al. Prediction of HER2-positive breast cancer recurrence and metastasis risk from histopathological images and clinical information via multimodal deep learning[J]. Comput Struct Biotechnol J, 2022, 20: 333-342. DOI:10.1016/j.csbj.2021.12.028
[13]
Jain RK, Mehta R, Dimitrov R, et al. Atypical ductal hyperplasia: interobserver and intraobserver variability[J]. Mod Pathol, 2011, 24(7): 917-923. DOI:10.1038/modpathol.2011.66
[14]
Noorbakhsh J, Farahmand S, Foroughi PA, et al. Deep learning-based cross-classifications reveal conserved spatial behaviors within tumor histological images[J]. Nat Commun, 2020, 11(1): 6367. DOI:10.1038/s41467-020-20030-5
[15]
Jansen I, Lucas M, Bosschieter J, et al. Automated Detection and Grading of Non-Muscle-Invasive Urothelial Cell Carcinoma of the Bladder[J]. Am J Pathol, 2020, 190(7): 1483-1490. DOI:10.1016/j.ajpath.2020.03.013
[16]
Robertson AG, Kim J, Al-Ahmadie H, et al. Comprehensive Molecular Characterization of Muscle-Invasive Bladder Cancer[J]. Cell, 2017, 171(3): 540-556. e25. DOI:10.1016/j.cell.2017.09.007
[17]
Woerl AC, Eckstein M, Geiger J, et al. Deep Learning Predicts Molecular Subtype of Muscle-invasive Bladder Cancer from Conventional Histopathological Slides[J]. Eur Urol, 2020, 78(2): 256-264. DOI:10.1016/j.eururo.2020.04.023
[18]
Khosravi P, Kazemi E, Imielinski M, et al. Deep Convolutional Neural Networks Enable Discrimination of Heterogeneous Digital Pathology Images[J]. EBioMedicine, 2018, 27: 317-328. DOI:10.1016/j.ebiom.2017.12.026
[19]
Sylvester RJ, van der Meijden AP, Oosterlinck W, et al. Predicting recurrence and progression in individual patients with stage Ta T1 bladder cancer using EORTC risk tables: a combined analysis of 2596 patients from seven EORTC trials[J]. Eur Urol, 2006, 49(3): 466-477. DOI:10.1016/j.eururo.2005.12.031
[20]
Fernandez-Gomez J, Madero R, Solsona E, et al. Predicting nonmuscle invasive bladder cancer recurrence and progression in patients treated with bacillus Calmette-Guerin: the CUETO scoring model[J]. J Urol, 2009, 182(5): 2195-2203. DOI:10.1016/j.juro.2009.07.016
[21]
Jobczyk M, Stawiski K, Fendler W, et al. Validation of EORTC, CUETO, and EAU risk stratification in prediction of recurrence, progression, and death of patients with initially non-muscle-invasive bladder cancer (NMIBC): A cohort analysis[J]. Cancer Med, 2020, 9(11): 4014-4025. DOI:10.1002/cam4.3007
[22]
Kluth LA, Black PC, Bochner BH, et al. Prognostic and Prediction Tools in Bladder Cancer: A Comprehensive Review of the Literature[J]. Eur Urol, 2015, 68(2): 238-253. DOI:10.1016/j.eururo.2015.01.032
[23]
Xylinas E, Kent M, Kluth L, et al. Accuracy of the EORTC risk tables and of the CUETO scoring model to predict outcomes in non-muscle-invasive urothelial carcinoma of the bladder[J]. Br J Cancer, 2013, 109(6): 1460-1466. DOI:10.1038/bjc.2013.372
[24]
Babjuk M, Burger M, Capoun O, et al. European Association of Urology Guidelines on Non-muscle-invasive Bladder Cancer (Ta, T1, and Carcinoma in Situ)[J]. Eur Urol, 2022, 81(1): 75-94. DOI:10.1016/j.eururo.2021.08.010
[25]
Lucas M, Jansen I, van Leeuwen TG, et al. Deep Learning-based Recurrence Prediction in Patients with Non-muscle-invasive Bladder Cancer[J]. Eur Urol Focus, 2022, 8(1): 165-172. DOI:10.1016/j.euf.2020.12.008
[26]
Coudray N, Ocampo PS, Sakellaropoulos T, et al. Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning[J]. Nat Med, 2018, 24(10): 1559-1567. DOI:10.1038/s41591-018-0177-5
[27]
Loeffler CML, Ortiz Bruechle N, Jung M, et al. Artificial Intelligence-based Detection of FGFR3 Mutational Status Directly from Routine Histology in Bladder Cancer: A Possible Preselection for Molecular Testing?[J]. Eur Urol Focus, 2022, 8(2): 472-479. DOI:10.1016/j.euf.2021.04.007
[28]
Nojima S, Terayama K, Shimoura S, et al. A deep learning system to diagnose the malignant potential of urothelial carcinoma cells in cytology specimens[J]. Cancer Cytopathol, 2021, 129(12): 984-995. DOI:10.1002/cncy.22443
[29]
Sanghvi AB, Allen EZ, Callenberg KM, et al. Performance of an artificial intelligence algorithm for reporting urine cytopathology[J]. Cancer Cytopathol, 2019, 127(10): 658-666. DOI:10.1002/cncy.22176
[30]
Awan R, Benes K, Azam A, et al. Deep learning based digital cell profiles for risk stratification of urine cytology images[J]. Cytometry A, 2021, 99(7): 732-742. DOI:10.1002/cyto.a.24313