中国医科大学学报  2023, Vol. 52 Issue (8): 694-698

文章信息

张舒婉, 张文川, 张喆, 迂金洋, 谢伦昀, 吕庆杰
ZHANG Shuwan, ZHANG Wenchuan, ZHANG Zhe, YU Jinyang, XIE Lunyun, LÜ Qingjie
人工智能在宫颈病变初步筛查中的应用
Benefits of applying artificial intelligence in preliminary screening of cervical lesions
中国医科大学学报, 2023, 52(8): 694-698
Journal of China Medical University, 2023, 52(8): 694-698

文章历史

收稿日期:2022-11-16
网络出版时间:2023-07-28 13:17:40
人工智能在宫颈病变初步筛查中的应用
中国医科大学附属盛京医院病理科, 沈阳 110004
摘要目的 探讨人工智能(AI)辅助细胞学系统对宫颈细胞学初筛及Bethesad系统(TBS)分级诊断的效能,明确AI在宫颈病变筛查中的灵敏度及阴性诊断可靠性。方法 选取我院29 354例宫颈细胞学涂片进行AI及人工阅片诊断,其中2 246例取得病理活检结果,比较分析AI的灵敏度和特异度。结果 以人工复核结果为液基细胞学检查(TCT)最终诊断,AI诊断的灵敏度为98.59%,特异度为60.41%,阴性预测值高达99.66%。AI灵敏度高,可减少漏诊;特异度较低,阳性病例需人工复核;AI阴性诊断准确性极高,无需人工复核。AI漏诊率(1.41%)低于人工(2.69%),差异有统计学意义,无低度鳞状上皮内病变(LSIL)及以上级别漏诊。AI与人工诊断TBS系统总体符合率为57.71%,Kappa值为0.371,提示AI分级诊断准确性低。以组织病理学为金标准,AI灵敏度为97.15%、特异度为38.01%、阴性预测值为83.97%。人工阅片灵敏度为89.64%、特异度为48.26%、阴性预测值为64.69%。提示AI有较高的灵敏度及阴性预测值。结论 AI是一种有效的宫颈病变筛查的新手段,灵敏度高,漏诊率低,可有效做到阴、阳性分流,适用于宫颈病变的大规模筛查。
关键词人工智能    宫颈细胞学    筛查    
Benefits of applying artificial intelligence in preliminary screening of cervical lesions
Department of Pathology, Shengjing Hospital of China Medical University, Shenyang 110004, China
Abstract: Objective This study aimed to explore the efficacy of artificial intelligence (AI) assisted cytology system in the primary screening diagnosis of cervical cytology, assess the efficacy of AI in grading diagnosis of cervical cytology TBS, and evaluate the sensitivity of AI in screening cervical lesions and the reliability of negative diagnosis. Methods 29 354 cervical cytology smear specimens in our hospital were diagnosed using AI and by manual reading. Overall, 2 246 of these specimens were pathological biopsies. The sensitivity and specificity of AI were compared with those of manual reading and were analyzed. Results The final diagnosis of TCT was based on the results of the manual review. The sensitivity, specificity, and negative predictive value of AI diagnoses were 98.59%, 60.41%, and 99.66%, respectively. Our findings revealed the following: AI has high sensitivity, which can reduce the rate of of missed diagnoses; the specificity of AI is low, and positive cases need manual review; and the accuracy of AI in making negative diagnoses is extremely high, and manual review is not needed. The missed diagnosis rate of AI (1.41%) was lower than that of manual diagnosis (2.69%), and the difference was statistically significant. There was no missed diagnosis of LSIL or above. The overall coincidence rate between AI and manual diagnosis TBS system was 57.71% and the Kappa value was 0.371, which indicated that the accuracy of AI grading diagnosis was low. Taking histopathology as the gold standard, the sensitivity, specificity, and negative predictive value of AI were 97.15%, 38.01%, and 83.97%, respectively. Furthermore, the sensitivity, specificity, and negative predictive value of manual reading were 89.64%, 48.26%, and 64.69%, respectively. AI has high sensitivity and negative predictive value. Conclusion AI is an effective novel method for screening cervical lesions with high sensitivity and low rates of missed diagnoses. AI can effectively distinguish negative cases from positive cases and is suitable for large-scale screening of cervical lesions.
Keywords: artificial intelligence    cervical cytology    screening    

宫颈癌是女性发病率最高的生殖系统恶性肿瘤,居全球女性恶性肿瘤第4位。据统计,2020年全球有超60万宫颈癌新发病例以及34万死亡病例,发病率和死亡率呈现增长趋势[1-2]。目前,对宫颈相关疾病的筛查诊断多采用三阶梯诊疗法:液基细胞学检查(thinprep cytology test,TCT)、阴道镜检查及宫颈多点活检组织病理学检查[3]。自上个世纪以来,宫颈TCT在降低宫颈癌的发病率和死亡率方面已经取得了一定的成果[1, 4-5],是宫颈癌早期防治的重要手段。

目前,Bethesad系统(TBS)系统是多个国家采用的诊断标准[6]。然而在诊断过程中,宫颈细胞学筛查仍然面临着专业医师数量不足、在阅片过程中缺乏标准化的人群筛查质量控制体系等问题[7]。而人工智能(artificial intelligence,AI)可以有效地解决这些问题。同时,AI可以做到对细胞学涂片的质控。AI现已应用到医学领域的各个方面[8-11],在辅助病理医师进行宫颈细胞学筛查与诊断方面有望取得巨大突破。

1 材料与方法 1.1 一般资料

选取2020年1月至2021年10月于中国医科大学附属盛京医院妇产科门诊、生殖中心进行宫颈细胞学检查的29 354例女性患者,年龄14~89岁,平均年龄为(42.99±11.53)岁。为更好地检验AI的筛查效能,本研究加入了1 400张人工已明确诊断为低度鳞状上皮内病变(low grade squamous intra-epithelial lesion,LSIL)(1 150张)及高度鳞状上皮内病变(high-grade squamous in traepithelical lesion,HSIL)(250张)的阳性涂片。29 354例均进行了随访,随访时间为373~631 d。其中2 246例取组织病理学活检。纳入标准:(1)所有患者接受细胞学筛查前无宫颈手术史;(2)所有患者在进行细胞学与组织病理学检查间隔内,未进行宫颈相关治疗。排除标准:(1)细胞数量 < 5 000个/张;(2)无清晰视野。本研究获得我院伦理委员会批准(编号:2023PS726K)。

1.2 检查方法

TCT取样,医师在扩阴器辅助下使用宫颈刷伸入宫颈管约0.8~1 cm后旋转3~5圈,取出宫颈刷后,浸泡在固定液中。震荡离心,取细胞悬液制成薄层细胞学涂片1张,进行巴氏染色。

1.3 AI识别宫颈细胞学涂片

采用深思考巧思宫颈细胞学AI辅助阅片系统(天津京润杰科技有限公司),1次可以在扫描仪上加载200张载玻片。该扫描仪配备电荷耦合器件图像传感器(CCD)和复消色差物镜(APO)20倍物镜(数值孔径为0.75 NA),可捕获像素尺寸为0.25 μm的图像。

应用扫描仪将宫颈细胞玻片电子化,采用多模态深度学习细胞检测算法,细胞图像通过FOV处理器,分为细胞团簇、单个细胞、腺细胞等多个区域,通过全局的AI综合判读算法,完成TBS的辅助分级,将细胞数≥5 000且扫描清晰的细胞学涂片判定为合格样本。

1.4 人工液基薄层细胞学检查

细胞学结果根据TBS系统分为7组:(1)无上皮内病变或恶性病变(negative for intraepithelial lesion or malignancy,NILM);(2)意义不明的非典型鳞状细胞(atypical squamous cells of undetermined significance,ASC-US);(3)非典型鳞状上皮细胞不除外高度恶变(atypical squamous cells,cannot exclude HSIL,ASC-H);(4)低度鳞状上皮内病变(low grade squamous intra-epithelial lesion,LSIL);(5)高度鳞状上皮内病变(high-grade squamous in traepithelical lesion,HSIL);(6)鳞状细胞癌(squamouscell carcinoma,SCC);(7)非典型腺细胞(adenocarcinoma glandular carcinoma,AGC)及以上病变。根据TBS分级系统,NILM为阴性,ASC-US及以上者判定为阳性。

1.5 电子阴道镜及组织病理学检查

在醋酸试验异常区以及碘试验阴性区多点取活检,宫颈无明显病变者于3、6、9和12点常规取活检。组织病理学诊断包括:(1)正常或慢性宫颈炎;(2)LSIL/宫颈上皮内瘤变(cervical intraepithelial neoplasia,CIN)Ⅰ级;(3)HSIL(CINⅡ级、CINⅢ级或宫颈原位癌);(4)宫颈原位腺癌;(5)宫颈浸润性癌。

1.6 2组诊断方法及判读标准

AI与人工阅片判读双盲试验。同一张细胞学涂片,AI与人工判读分别进行。病理医师根据显微镜下液基细胞学涂片的形态进行诊断,诊断内容根据标准TBS分级系统。AI组对细胞学涂片进行扫描和诊断,诊断内容同医师组。两者判读结果一致的,不再复核。若两者诊断结果不同,则由另外2名病理科权威专家会诊,使用多头显微镜共同讨论给出最终诊断。以复核后结果为TCT最终诊断。

1.7 统计学分析

采用SPSS 26. 0软件对数据进行统计分析,组间比较采用χ2检验,P < 0.05为差异有统计学意义。2种诊断方式的一致性比较采用Kappa系数评价,Kappa > 0.75为一致性极好,Kappa 0.40~0.75为中高度一致,Kappa < 0.40为一致性差。

2 结果 2.1 AI检测效能

为加强检验AI效能,特加入1400张已由病理医师诊断为LSIL(1 150张)及HSIL(250张)细胞学涂片,且AI诊断均提示为阳性。AI与病理医师分别对29 354例细胞学涂片进行阅片诊断。AI阅片结果显示,47.13%(13 836/29 354)提示为阳性,其中37.02%(10 867/29 354)为ASC-US,4.51%(1 323/29 354)为ASC-H,4.28%(1 254/29 354)为LSIL,0.94%(275/29 354)为HSIL,0.40%(117/29 354)为AGC,52.87%(15 518/29 354)为NILM。人工阅片结果显示,8.83%为(2 468/27 954)阳性,其中4.88%(1 364/27 954)为ASC-US,0.51%(142/27 954)为ASC-H,2.89%(804/27 954)为LSIL,0.19%(53/27 954)为HSIL,0.34%(96/27 954)为AGC,1例为SCC,5例结果为阳性,但无法准确判断病变细胞来源。91.17%(25 486/27 954)提示为NILM。ASC/SIL质控比例区间为1.5~3∶1,本研究中ASC-US(1 364张)和ASC-H(142张),LSIL(1 957张)和HSIL(303张)排除特意选出的1 400张LSIL及HSIL,实际为860张,ASC/SIL(1 506/860)比值为1.75∶1,符合质控要求。

为确保阳性检出率有意义,在计算时不纳入加入的1 400张阳性细胞学涂片,AI及人工阅片的总阳性率分别为44.49%(12 436/27 954)及8.83%(2 468/27 954),AI阳性检出率高于人工检出率,差异有统计学意义(P < 0.001,χ2=2 193.55)。以复核后结果为TCT最终诊断,AI诊断的灵敏度为98.59%(3 703/3 756),特异度为60.41%(15 465/25 598),阳性预测值为26.76%(3 703/13 836),阴性预测值为99.66%(15 465/15 518)。结果显示,AI灵敏度高,可减少漏诊风险;特异度较低,阳性预测值低,阳性病例需人工复核以提高准确性;AI阴性预测值高达99.66%,意味着AI阴性诊断准确性极高,可无需人工复核。

2.2 AI与人工漏诊率比较

在10 500例AI与病理医师判读结果不符的病例中,AI阴性但人工阳性的266例中,53例复核后为阳性,其中49例为ASC-US,1例ASC-H,3例AGC,213例复核后仍为阴性。AI阳性但人工阴性的10 234例中,101例复核后为阳性,其中80例复核诊断为ASC-US,4例ASC-H,14为LSIL,3例HSIL,10 133例复核后为阴性。

AI检测漏诊率1.41%(53/3 756)低于人工阅片漏诊率2.69%(101/3 756)。差异有统计学意义(χ2=14.96,P < 0.05)。且AI无LSIL及以上级别漏诊。

AI检测的过诊率为39.59%(10 133/25 598),高于人工阅片的过诊率[0.83%(213/25 598)],差异有统计学意义(χ2=9 612.37,P < 0.001)。AI过诊率虽较高,但可减少漏诊。

2.3 AI与人工诊断TBS分级一致性比较

在AI与人工诊断均为阳性的3 602例中,其中5例结果虽为阳性,但无法判断病变细胞来源,故不纳入一致性比较中,AI与人工诊断TBS分级一致性比较结果如表 1所示,总体符合率为57.71%,Kappa值为0.371(95%CI:0.35~0.39)。提示AI在TBS分级诊断的准确性方面较低,仅可用于辅助诊断分级。但AI可将病变细胞或细胞团进行定位标注,避免人工在阅片过程中遗漏可疑病变细胞,提高工作效率。

表 1 AI与人工诊断TBS分级一致性比较 Tab.1 Comparison of the grading consistency of AI and that of manual diagnosis TBS
The number of consistent diagnoses between AI and manual diagnosis in different grades The consistency between AI and manual diagnosis
AI pathologist ASC-US ASC-H LSIL HSIL SCC AGC Grade Agreement rate(%) Kappa(95%CI
ASC-US [n(%)] 875(77.5) 18(12.9) 747(38.4) 5(1.7) 0(0) 27(33.8) ASC-US 70.78 0.400(0.37-0.43)
ASC-H [n(%)] 78(6.9) 79(56.4) 213(11.0) 118(38.9) 0(0) 34(42.5) ASC-H 85.99 0.189(0.15-0.23)
LSIL [n(%)] 159(14.1) 13(9.3) 948(48.8) 11(3.6) 0(0) 1(1.3) LSIL 40.84 0.363(0.34-0.39)
HSIL [n(%)] 13(1.2) 30(21.4) 35(1.8) 169(55.8) 1(100.0) 13(16.3) HSIL 93.72 0.565(0.50-10.62)
SCC [n(%)] 0(0) 0(0) 0(0) 0(0) 0(0) 0(0) SCC 68.50 0
AGC [n(%)] 4(0.4) 0(0) 1(0.1) 0(0) 0(0) 5(6.3) AGC 97.78 0.107(0.02-0.19)
Total [n(%)] 1 129 140 1 944 303 1 80 Total 57.71 0.371(0.35-0.39)

2.4 AI、人工阅片与活检病理结果

全部患者中追踪到2 246例接受了阴道镜检查并取活检,634例(28.23%)为慢性宫颈炎,1 066例(47.46%)为LSIL(CINⅠ),438例(19.50%)为HSIL(包括CINⅡ、CINⅢ或原位癌),8例(0.36%)为原位腺癌,102例(4.54%)为宫颈浸润性癌(包括宫颈SCC80例、腺癌16例、腺鳞癌3例、神经内分泌癌1例、透明细胞癌1例以及黏液腺癌1例)。见表 2图 1

表 2 AI及人工诊断结果比较 Tab.2 Comparison of pathological results between AI and manual diagnosis
Item AI Manual diagnosis
NILM ASC-US ASC-H LSIL HSIL AGC SCC NILM ASC-US ASC-H LSIL HSIL AGC SCC
Chronic cervicitis 241 303 28 60 2 0 0 306 161 5 148 5 9 0
LSIL 40 449 88 477 10 2 0 126 195 12 707 17 9 0
HSIL 6 97 177 39 117 0 0 34 54 67 130 146 5 0
Cervical adenocar-cinoma in situ 0 1 3 0 4 0 0 1 0 1 0 3 3 0
Invasive carcinoma 0 2 44 2 54 0 0 6 6 9 1 72 7 1
Total 287 852 340 578 187 2 0 473 416 94 986 243 33 1

A, both AI and artificial diagnosis identify NILM; B, AI diagnosis identifies ASC-US, while manual diagnosis identifies NILM; C, both AI and artificial diagnosis identify ASC-H; D, both AI and artificial diagnosis identify LSIL; E, both AI and artificial diagnosis identify HSIL; F, AI recognizes fuzzy overlapping nuclei as HSIL. Black box for AI suggesting diseased cell mass. 图 1 TCT结果×200 Fig.1 TCT results ×200

以病理组织学检查为诊断的金标准,AI的灵敏度、特异度、阳性预测值、阴性预测值分别为97.15%(1 566/1 612)、38.01%(241/634)、79.94%(1 566/1 959)、83.97%(241/287)。人工阅片的灵敏度、特异度、阳性预测值、阴性预测值分别为89.64%(1 445/1 612)、48.26%(306/634)、81.50%(1 445/1 773)、64.69%(306/473)。AI与人工阅片以ASC-US及以上作为阳性标准时,AI的灵敏度(97.15%)高于人工阅片(89.64%),差异有统计学意义(P < 0.001,χ2 =130.86)。AI的特异度(38.01%)低于人工阅片的特异度(48.26%),差异有统计意义(P < 0.001,χ2=206.10)。表明AI具有较高的灵敏度及阴性预测值。

2.5 AI与人工阅片时间比较

日常工作中,病理医师完成1张宫颈涂片的TBS诊断通常需要2~10 min,AI仅需2 min 45 s则可完成对涂片上每个细胞的扫描并给出最后诊断结果。另外,AI可以24 h工作,节约了医师的工作时间。

3 讨论

宫颈癌是妇科最常见的恶性肿瘤之一。早发现、早治疗可有效控制疾病发展。但TCT涂片受到细胞重叠、炎症反应等因素影响,易出现漏诊情况[12]

细胞学的筛查需要高质量卫生系统,国内细胞学质控存在病理医师人员不足,细胞学涂片样本数量逐年增加,各地区对细胞学质控认识差距较大等问题,AI系统提供了解决这些困难的机会,甚至可辅助基层医生实现“云诊断”。

本研究在AI应用于辅助宫颈病变的初步筛查中有新的发现。首先,AI可排除60%以上阴性涂片,且阴性预测值> 99%,说明AI阴性诊断准确性极高。该结果与国内部分研究[13]结论一致。其次,本研究发现,AI的灵敏度(97.00%)高于人工阅片(89.12%)。AI漏诊率(1.41%)较人工阅片(2.69%)低,且无LSIL及以上病变的漏诊。再次,AI阅片时间短,可连续工作。这些结果均表明,AI在有效降低漏诊风险的前提下,可以减少人工阅读阴性细胞学涂片的数量。当然,AI初筛更要严格进行质控,阴性病例抽检10%,以有效监督AI工作状态。

在本研究中,AI阅片也存在一定的局限性。首先,AI诊断的假阳性率高,AI的特异度(38.01%)低于人工阅片(48.26%),需要人工进一步确诊。宫颈病变筛查的意义是发现早期病变,因此对筛查手段的灵敏度有较高要求,低灵敏度会导致较多患者被漏诊,错过最佳治疗时期。其次,AI对腺细胞病变不够敏感,复核时发现,AI诊断为AGC的107例中,37例为萎缩性病变,8例为感染性病变,并在随访中发现,其中1例为子宫内膜样腺癌。AI也易将扫描模糊的细胞核或呈萎缩性改变的细胞诊断为ASC-H或HSIL,这也是导致AI过诊率高的原因之一。因此,AI诊断为阳性的病例需要人工复核,除外假阳性。AI对细胞学具体分级诊断的能力较差,和病理医师诊断之间的符合率低,Kappa值为0.371,一致性较差,但是AI可定位细胞学涂片所有病变细胞和细胞团,避免遗漏病变细胞,起到辅助诊断的作用。本研究中仅2 246例患者进行了组织学活检,活检标本数量较少,结果还需多中心、大样本验证。在未来工作中,将对AI辅助诊断系统进行反复修正,结合患者临床信息,降低假阳性率,提高排阴率及诊断效能。

综上所述,AI辅助细胞学诊断是一种有效的宫颈病变筛查的新手段,具有灵敏度高、漏诊率低的特点。AI可有效做到阴、阳性分流,阴性诊断准确性极高,无需人工复核。在有效规避漏诊风险的同时减轻病理医师的工作负担,提高工作效率。AI具有广泛应用前景,适用于宫颈病变大规模筛查。

参考文献
[1]
RAHMAN R, CLARK MD, COLLINS Z, et al. Cervical cancer scree-ning decentralized policy adaptation: an African rural-context-specific systematic literature review[J]. Glob Health Action, 2019, 12(1): 1587894. DOI:10.1080/16549716.2019.1587894
[2]
SUNG H, FERLAY J, SIEGEL RL, et al. Global cancer statistics 2020:globocan estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA A Cancer J Clin, 2021, 71(3): 209-249. DOI:10.3322/caac.21660
[3]
WANG M, HOU B, WANG XZ, et al. Diagnostic value of high-risk human papillomavirus viral load on cervical lesion assessment and ASCUS triage[J]. Cancer Med, 2021, 10(7): 2482-2488. DOI:10.1002/cam4.3653
[4]
BHATLA N, SINGHAL S. Primary HPV screening for cervical cancer[J]. Best Pract Res Clin Obstet Gynaecol, 2020, 65: 98-108. DOI:10.1016/j.bpobgyn.2020.02.008
[5]
FOROUZANFAR MH, FOREMAN KJ, DELOSSANTOS AM, et al. Breast and cervical cancer in 187 countries between 1980 and 2010:a systematic analysis[J]. Lancet, 2011, 378(9801): 1461-1484. DOI:10.1016/S0140-6736(11)61351-2
[6]
NAYAR R, WILBUR DC. The Bethesda system for reporting cervical cytology: a historical perspective[J]. Acta Cytol, 2017, 61(4/5): 359-372. DOI:10.1159/000477556
[7]
BALDAUF JJ, FENDER M, BAULON E. Screening and early diagnosis of cervical cancer[J]. Rev Prat, 2010, 60(2): 213-218.
[8]
BAXI V, EDWARDS R, MONTALTO M, et al. Digital pathology and artificial intelligence in translational medicine and clinical practice[J]. Mod Pathol, 2022, 35(1): 23-32. DOI:10.1038/s41379-021-00919-2
[9]
CORTI C, COBANAJ M, DEE EC, et al. Artificial intelligence in cancer research and precision medicine: applications, limitations and priorities to drive transformation in the delivery of equitable and unbiased care[J]. Cancer Treat Rev, 2023, 112: 102498. DOI:10.1016/j.ctrv.2022.102498
[10]
SATO M, HORIE K, HARA A, et al. Application of deep learning to the classification of images from colposcopy[J]. Oncol Lett, 2018, 15(3): 3518-3523. DOI:10.3892/ol.2018.7762
[11]
HU LM, BELL D, ANTANI S, et al. An observational study of deep learning and automated evaluation of cervical images for cancer screening[J]. J Natl Cancer Inst, 2019, 111(9): 923-932. DOI:10.1093/jnci/djy225
[12]
张喆, 孔令婷, 孙寒雪, 等. 细胞DNA定量分析在宫颈病变筛查中的应用价值[J]. 中国医科大学学报, 2017, 46(11): 1013-1018. DOI:10.12007/j.issn.0258-4646.2017.11.012
[13]
BAO HL, SUN XR, ZHANG Y, et al. The artificial intelligence-assisted cytology diagnostic system in large-scale cervical cancer screening: a population-based cohort study of 0.7 million women[J]. Cancer Med, 2020, 9(18): 6896-6906. DOI:10.1002/cam4.3296