文章信息
- 张苗苗, 高子逸, 吴琼, 王影
- Zhang Miaomiao, Gao Ziyi, Wu Qiong, Wang Ying
- C-TIRADS和人工智能辅助诊断系统在甲状腺结节诊断中的价值
- Value of C-TIRADS and artificial intelligence assisted diagnosis system in diagnosis of thyroid nodules
- 实用肿瘤杂志, 2025, 40(5): 447-451
- Journal of Practical Oncology, 2025, 40(5): 447-451
基金项目
- 河北省省级科技计划资助(21377777D)
-
通信作者
- 王影,Email:dina513@163.com
-
文章历史
- 收稿日期:2024-12-16
高达68%的无症状成人发现甲状腺结节,其中约7%~15%的甲状腺结节是甲状腺癌[1]。目前,超声是甲状腺结节诊断的主要成像方式[2],但部分甲状腺良恶性结节的二维超声图像特征多有重叠[3],因此超声医师有必要对甲状腺结节进行分类。针对我国国情制定的中国甲状腺影像报告和数据系统(Chinese-Thyroid Imaging Reporting and Data System, C-TIRADS)在甲状腺结节恶性肿瘤风险分层中表现良好[4-5]。本研究回顾性分析甲状腺结节的超声图像,比较人工智能(artificial intelligence, AI)辅诊系统与医师应用C-TIRADS的诊断效能,并分组分析AI辅诊系统与医师针对不同超声特征结节诊断的准确度,探讨AI辅诊系统在临床工作中适宜的应用条件。
1 资料与方法 1.1 研究对象收集2020年5月至2023年5月于河北医科大学第二医院行甲状腺外科手术的患者977例。纳入标准:(1)超声检查初步诊断的甲状腺结节;(2)甲状腺结节有明确的病理结果。排除标准:(1)病理资料不完整,超声图像不够清晰,无法进行分析者;(2)患有其他类型恶性肿瘤;(3)目标结节超出切面的观察范围;(4)病理结果不明确。最终纳入977例患者的1 039个甲状腺结节,其中男性205例,女性772例;年龄16~80岁,(49.0±12.8)岁。本研究经河北医科大学第二医院伦理委员会批准(审批号: 2021-R209)。
1.2 仪器与方法超声检查使用Acuson S2000(西门子医疗系统有限公司,德国)和ARIETTA 70(株式会社日立制作所,日本)超声诊断仪,选择浅表器官模式下频率为4~18 MHz的线阵探头。术前超声检查和超声图像的保留由1名工作经验 > 10年的超声科医师完成。嘱患者平卧位,头后仰,充分暴露颈前区,然后对甲状腺腺体进行整体常规扫查,对目标病灶行多切面探查。所有超声图像均需清晰显示结节声像图特征,可包括结节纵切面、横切面和斜切面。
3名分别具备2、5和10年超声工作经验的医师独立对患者超声图像进行回顾性分析,并按照2020版C-TIRADS诊断标准进行评分并分类[4],主要指标:结构(囊性、囊实性、实性、实性为主和囊性为主)、边缘(光整、模糊、不规则和甲状腺外侵犯)、方位(垂直位和水平位)、回声(无回声、极低回声、低回声、等回声和高回声)和局灶性强回声(无局灶性强回声、粗钙化、周边钙化、微钙化、彗星尾伪像和意义不明确的点状强回声)。当分类结果不一致时,由2名分别具有5和10年工作经验的超声科医师协商给出结果并记录。
1.3 AI辅助诊断软件采用什维新智医疗科技(上海)有限公司的超声影像智能辅助诊断系统,将能清晰显示甲状腺结节声像图特征的图像导入超声AI辅诊系统,手动勾画感兴趣区(region of interest, ROI),将结节边界全部圈定在内,软件自动分析结节回声、边缘和钙化等特征的情况,同时得出C-TIRADS分类结果,当所得结果不一致时取分类最高者(图 1)。
|
| 注 A:右侧腺叶结节,位于中部,大小1.29 cm×0.84 cm,实性低回声,边缘不光整,内见点状强回声,C-TIRADS 4C类;B:AI辅助诊断系统自动勾画甲状腺结节(纵切面),C-TIRADS 4C类 图 1 医师和AI辅助诊断系统依据C-TIRADS对1例32岁女性患者的甲状腺结节分类 Fig.1 Thyroid nodules in a 32-year-old female patient classified by physicians and the AI-assisted diagnosis system based on C-TIRADS |
采用SPSS 26.0软件进行数据分析。计数资料采用频数(百分比)表示,组间比较采用χ2检验。计量资料采用均数±标准差(x±s)表示。以病理结果为金标准,建立受试者工作特征(receiver operating characteristic, ROC)曲线分析AI辅诊系统和医师对甲状腺结节的分类诊断结果,计算曲线下面积(area under the curve, AUC),采用DeLong检验比较AUC的差异,并根据约登指数最大的点作为诊断结果的最佳截断值,计算敏感度、特异度和准确度。以P < 0.05为差异具有统计学意义。
2 结果 2.1 临床病理资料977例患者共1 039个甲状腺结节中,左侧叶548个,右侧叶442个,峡部49个。直径0.25~7.70 cm,(1.85±1.46)cm。恶性结节535个,包括甲状腺乳头状癌530个,滤泡癌4个,髓样癌1个。良性结节504个,包括结节性甲状腺肿465个,滤泡性腺瘤23个,慢性淋巴细胞性甲状腺炎13个,嗜酸细胞腺瘤3个。
2.2 医师和AI辅诊系统诊断效能分析以术后病理结果作为金标准,制作ROC曲线分析AI辅诊系统和医师对甲状腺结节的分类诊断结果。结果显示,AI辅诊系统和医师诊断的AUC分别为0.908和0.912(表 1)。采用约登指数最大的点作为2种诊断方法的最佳截断值,AI辅诊系统与医师的诊断界值分别为C-TIRADS 4A和C-TIRADS 4B类(图 2)。在最佳诊断效果时,AI辅诊系统和医师的诊断准确度分别为85.9%和83.6%(P=0.143),敏感度分别为85.8%和82.1%(P=0.096),特异度分别为86.1%和85.3%(P=0.719),二者诊断水平相当。
| 诊断结果 | 病理学检查(例) | 敏感度(%) | 特异度(%) | 准确度(%) | AUC | |
| 良性 | 恶性 | |||||
| 医师 | 82.1 | 85.3 | 83.6 | 0.912 | ||
| 恶性 | 74 | 439 | ||||
| 良性 | 430 | 96 | ||||
| AI辅诊系统 | 85.8 | 86.1 | 85.9 | 0.908 | ||
| 恶性 | 70 | 459 | ||||
| 良性 | 434 | 76 | ||||
| χ2/Z值 | 2.771 | 0.013 | 2.150 | 0.383 | ||
| P值 | 0.096 | 0.719 | 0.143 | 0.702 | ||
| 注 AI:人工智能(artificial intelligence);AUC:曲线下面积(area under the curve) | ||||||
|
| 注 AI:人工智能(artificial intelligence) 图 2 AI辅助诊断系统与医师诊断甲状腺结节的ROC曲线比较 Fig.2 ROC curves of the AI assisted diagnosis system versus physician diagnosis for thyroid nodules |
依据2020版C-TIRADS 5个词典类别(方位、边缘、结构、回声和局灶性强回声)进行分类显示,在边缘、回声和局灶性强回声方面,对于边缘模糊、低回声和粗钙化的结节,AI辅诊系统诊断的准确度高于医师(均P < 0.05,表 2);在结构方面,对于囊性为主的结节,AI辅诊系统诊断的准确度有高于医师的趋势,但是差异无统计学意义(P=0.191);在结节方位方面,AI辅诊系统和医师诊断的准确度比较,差异无统计学意义(均P > 0.05)。
| 结节特征 | 准确度 | χ2值 | P值 | |
| C-TIRADS | AI辅诊系统 | |||
| 回声 | ||||
| 低回声 | 81.9%(502/613) | 88.6%(543/613) | 10.896 | 0.001 |
| 等回声 | 83.8%(243/290) | 80.0%(232/290) | 1.407 | 0.236 |
| 高回声 | 84.8%(28/33) | 72.7%(24/33) | 1.451 | 0.228 |
| 极低回声 | 92.3%(84/91) | 90.1%(82/91) | 0.274 | 0.601 |
| 无回声 | 100.0%(12/12) | 100.0%(12/12) | 0.000 | 1.000 |
| 结构 | ||||
| 实性 | 81.8%(571/698) | 84.7%(591/698) | 2.054 | 0.152 |
| 实性为主 | 85.3%(209/245) | 85.3%(209/245) | 0.000 | 1.000 |
| 囊性为主 | 91.3%(73/80) | 96.3%(77/80) | 1.707 | 0.191 |
| 囊性 | 100.0%(9/9) | 100.0%(9/9) | 0.000 | 1.000 |
| 海绵状 | 100.0%(7/7) | 100.0%(7/7) | 0.000 | 1.000 |
| 边缘 | ||||
| 光整 | 82.1%(460/560) | 83.9%(470/560) | 0.634 | 0.426 |
| 模糊 | 84.5%(295/349) | 90.3%(315/349) | 5.201 | 0.023 |
| 不规则 | 89.2%(91/102) | 85.3%(87/102) | 0.705 | 0.401 |
| 甲状腺外侵犯 | 82.1%(23/28) | 75.0%(21/28) | 0.424 | 0.515 |
| 方位 | ||||
| 纵横比 > 1 | 95.7%(202/211) | 93.4%(197/211) | 1.497 | 0.284 |
| 纵横比≤1 | 81.2%(672/828) | 83.5%(691/828) | 1.150 | 0.221 |
| 局灶性强回声 | ||||
| 微钙化 | 82.5%(235/285) | 84.9%(242/285) | 0.630 | 0.427 |
| 粗钙化 | 68.1%(96/141) | 85.8%(121/141) | 12.496 | < 0.01 |
| 周边钙化 | 70.8%(17/24) | 87.5%(21/24) | 2.021 | 0.155 |
| 彗星尾伪像 | 96.4%(27/28) | 89.3%(25/28) | 1.077 | 0.299 |
| 意义不明确的点状强回声 | 87.8%(36/41) | 87.8%(36/41) | 0.000 | 1.000 |
| 无局灶性强回声 | 88.1%(458/520) | 86.2%(448/520) | 0.857 | 0.355 |
| 注 C-TIRADS:中国甲状腺影像报告和数据系统(Chinese-Thyroid Imaging Reporting and Data System);AI:人工智能(artificial intelligence) | ||||
目前,AI在超声领域对于甲状腺结节诊断的开发工作走在先锋行列。AI辅诊系统表现出较高的诊断价值[6-8],且克服了医师诊断过程中主观因素的影响。本研究对AI辅诊系统与医师的诊断水平进行比较,结果显示,AI辅诊系统与医师诊断水平相当,与相关研究结果一致[9-11]。本研究所采用的AI辅诊系统软件,可对甲状腺结节的超声特征进行分析,得出C-TIRADS分类结果。AI辅诊系统与医师的诊断界值分别为C-TIRADS 4A和C-TIRADS 4B类,在最佳截断值下探讨发现,AI辅诊系统漏诊率更低,535个恶性结节中,医师漏诊96个,而AI辅诊系统漏诊76个。与关于美国放射学会甲状腺影像报告和数据系统(American College of Radiology Thyroid Imaging Reporting and Data System, ACR-TIRADS)与AI辅诊系统诊断效能的相关研究结果一致[12-13]。基于此,AI辅诊系统可以客观地评估良恶性结节,诊断准确度可以达到高级医院超声医师的水平。此外,AI辅诊系统安全、无创、简单、高效且方便,如果用于医疗技术资源有限的地区或较小的医院,可以改善甲状腺结节的诊断和治疗。
在不同超声特征分组下分析发现,AI辅诊系统对于超声特征为低回声、边缘模糊和粗钙化的甲状腺结节,诊断准确度高于医师。因此临床工作中,针对表现为上述超声特征但性质难以评估的甲状腺结节,AI辅诊系统可更好地帮助诊断,增加医师在诊断此类甲状腺结节过程中的信心。
钙化灶是甲状腺癌的一个重要的影像学表现,广泛存在于良性和恶性甲状腺疾病中[14]。已有研究证明,微钙化的存在与甲状腺结节的恶性肿瘤有相关性[15-16],但粗钙化在超声诊断甲状腺结节良恶性中的效能仍存在争议,且C-TIRADS也未将粗钙化作为甲状腺结节超声恶性特征,因此医师对于含有粗钙化的甲状腺结节,诊断难度较大。本研究中AI辅诊系统对于粗钙化的结节诊断准确度为85.8%,医师准确度为68.1%,且二者诊断水平存在差异(P < 0.01), 提示AI辅诊系统可协助医师对于此类结节的诊断。应用过程中发现,AI辅诊系统对于微钙化与彗星尾伪像的区分能力有待提升,存在误将部分存在微钙化的恶性结节识别为存在彗星尾伪像的良性结节的问题,从而造成误诊,且对于部分伴有蛋壳样周边钙化的甲状腺结节,钙化的后方声影易导致结节的内部特征无法判断,而此种情况下,AI辅诊系统易将钙化的后方声影错误地识别为结节内部的无回声结构,从而影响对于甲状腺结节的正确分类。因此针对上述情况,建议医师在AI辅诊系统的分类结果基础上多加评估。
研究表明,甲状腺滤泡状癌与腺瘤的内部回声存在差异,滤泡状腺瘤内部回声多呈等至高回声,而腺癌以低回声为主[17],而本研究中所纳入的23个滤泡状腺瘤,其超声图像多表现出等回声结节,而AI辅诊系统对此类结节诊断水平低于医师,因此在AI辅诊系统诊断等回声类型结节过程中,医师应提高重视。
本研究中,AI辅诊系统对边缘模糊的结节诊断准确度高于医师(90.3% vs 84.5%),而对于甲状腺外侵犯的结节诊断准确度较低(75.0% vs 82.1%)。分析原因:(1)纳入甲状腺外侵犯结节的病例数过少;(2)结节腺体外侵犯时,甲状腺失去正常形态,AI无法识别。此后可加大甲状腺外侵犯结节的病例,重点分析AI辅诊系统对其的诊断效能。
本研究有一定的局限性:(1)本研究为单中心研究,后期需进一步扩大样本量,进行多中心研究;(2)AI辅诊系统目前无法对甲状腺弥漫性改变进行诊断,难以判断是否会对诊断结果造成影响;(3)本研究纳入的甲状腺恶性结节多为乳头状癌,而滤泡癌和髓样癌偏少,后期应加大对甲状腺滤泡癌和髓样癌等类型甲状腺癌的纳入,进行深入研究。
综上所述,AI辅诊系统对甲状腺结节的鉴别具有较高的敏感度、特异度和准确度。临床工作中,AI辅诊系统对超声特征为低回声、边缘模糊和粗钙化的结节诊断水平高于医师。
利益冲突 所有作者声明无利益冲突
| [1] |
Peng S, Liu YH, Lv WM, et al. Deep learning-based artificial intelligence model to assist thyroid nodule diagnosis and management: a multicentre diagnostic study[J]. Lancet Digit Health, 2021, 3(4): e250-e259. DOI:10.1016/S2589-7500(21)00041-8 |
| [2] |
Boers T, Braak SJ, Rikken NET, et al. Ultrasound imaging in thyroid nodule diagnosis, therapy, and follow-up: Current status and future trends[J]. J Clin Ultrasound, 2023, 51(6): 1087-1100. DOI:10.1002/jcu.23430 |
| [3] |
刘昕, 苏泳安, 李晓青. 微血流模式背景下超声造影对甲状腺癌的血流评估[J]. 实用肿瘤杂志, 2024, 39(1): 75-79. DOI:10.13267/j.cnki.syzlzz.2024.013 |
| [4] |
中华医学会超声医学分会浅表器官和血管学组, 中国甲状腺与乳腺超声人工智能联盟. 2020甲状腺结节超声恶性危险分层中国指南: C-TIRADS[J]. 中华超声影像学杂志, 2021, 30(3): 185-200. |
| [5] |
Hu Y, Xu SY, Zhan WW. Diagnostic performance of C-TIRADS in malignancy risk stratification of thyroid nodules: a systematic review and meta-analysis[J]. Front Endocrinol, 2022, 13: 938961. DOI:10.3389/fendo.2022.938961 |
| [6] |
Watkins L, O'Neill G, Young D, et al. Comparison of British Thyroid Association, American College of Radiology TIRADS and artificial intelligence TIRADS with histological correlation: diagnostic performance for predicting thyroid malignancy and unnecessary fine needle aspiration rate[J]. Br J Radiol, 2021, 94(1123): 20201444. DOI:10.1259/bjr.20201444 |
| [7] |
Potipimpanon P, Charakorn N, Hirunwiwatkul P. A comparison of artificial intelligence versus radiologists in the diagnosis of thyroid nodules using ultrasonography: a systematic review and meta-analysis[J]. Eur Arch Otorhinolaryngol, 2022, 279(11): 5363-5373. DOI:10.1007/s00405-022-07436-1 |
| [8] |
Yang LX, Lin N, Wang MY, et al. Diagnostic efficiency of existing guidelines and the AI-SONICTM artificial intelligence for ultrasound-based risk assessment of thyroid nodules[J]. Front Endocrinol, 2023, 14: 1116550. DOI:10.3389/fendo.2023.1116550 |
| [9] |
郑梅娟, 薛恩生, 俞悦, 等. C-TIRADS联合人工智能辅诊系统对甲状腺结节良恶性的诊断价值[J]. 肿瘤影像学, 2022, 31(5): 484-490. |
| [10] |
杨波, 李照喜, 周璐, 等. C-TIRADS人工智能辅助诊断系统在甲状腺可疑结节良恶性诊断中的应用[J]. 中国医学影像学杂志, 2023, 31(12): 1256-1261. |
| [11] |
Jin Z, Zhu YQ, Zhang SJ, et al. Diagnosis of thyroid cancer using a TI-RADS-based computer-aided diagnosis system: a multicenter retrospective study[J]. Clin Imaging, 2021, 80: 43-49. DOI:10.1016/j.clinimag.2020.12.012 |
| [12] |
Cui YY, Fu C, Si CF, et al. Analysis and comparison of the malignant thyroid nodules not recommended for biopsy in ACR TIRADS and AI TIRADS with a large sample of surgical series[J]. J Ultrasound Med, 2023, 42(6): 1225-1233. |
| [13] |
Wang B, Wan Z, Zhang MB, et al. Diagnostic value of a dynamic artificial intelligence ultrasonic intelligent auxiliary diagnosis system for benign and malignant thyroid nodules in patients with Hashimoto thyroiditis[J]. Quant Imaging Med Surg, 2023, 13(6): 3618-3629. |
| [14] |
罗玉君, 丁康, 刘强. 甲状腺结节钙化用于超声诊断甲状腺癌中的意义观察[J]. 影像研究与医学应用, 2020, 4(22): 144-145. |
| [15] |
O'Connor E, Mullins M, O'Connor D, et al. The relationship between ultrasound microcalcifications and psammoma bodies in thyroid tumours: a single-institution retrospective study[J]. Clin Radiol, 2022, 77(1): e48-e54. DOI:10.1016/j.crad.2021.09.014 |
| [16] |
Shi C, Li S, Shi T, et al. Correlation between thyroid nodule calcification morphology on ultrasound and thyroid carcinoma[J]. J Int Med Res, 2012, 40(1): 350-357. DOI:10.1177/147323001204000136 |
| [17] |
江琼, 林友国. 甲状腺滤泡状腺癌与良性结节的超声鉴别诊断[J]. 实用医学影像杂志, 2023, 24(3): 221-225. |
2025, Vol. 40


