1. 华东师范大学上海市多维度信息处理重点实验室,上海 200241;
2. 海军军医大学(第二军医大学)第一附属医院脊柱外科,上海 200433;
3. 西交利物浦大学人工智能与先进计算学院,苏州 215028;
4. 复旦大学信息科学与工程学院生物医学工程中心,上海 200433;
5. 美的集团人工智能创新中心,北京 100015
收稿日期: 2022-04-21 接受日期: 2022-07-01
基金项目: 上海市自然科学基金(21ZR1478600),海军军医大学(第二军医大学)“深蓝”医学人才“远航”人才项目.
Evaluation of ultrasonic images of pedicle screw channel based on machine learning
1. Shanghai Key Laboratory of Multidimensional Information Processing, East China Normal University, Shanghai 200241, China;
2. Department of Spinal Surgery, The First Affiliated Hospital of Naval Medical University (Second Military Medical University), Shanghai 200433, China;
3. School of AI and Advanced Computing, Xi'an Jiaotong-Liverpool University, Suzhou 215028, Jiangsu, China;
4. Center for Biomedical Engineering, School of Information Science and Engineering, Fudan University, Shanghai 200433, China;
5. Artificial Intelligence Innovation Center (AIIC), Midea Group, Beijing 100015, China
Supported by Natural Science Foundation of Shanghai (21ZR1478600) and "Long Voyage" Project of "Shenlan" Medical Talent of Naval Medical University (Second Military Medical University).
脊柱内固定融合术是一种常规的脊柱外科手术方式,椎弓根螺钉是目前应用最为广泛的内固定器械[1]。然而,由于人体的脊柱为复杂的三维结构且周围有许多重要组织,包括脊髓、神经根、大血管和胸腹部脏器等,手术过程中错误置钉可能引起严重并发症,甚至可导致瘫痪和死亡[2]。常规的手术方式是医师根据经验“徒手”置钉,再使用C形臂透视进行螺钉位置验证,螺钉置入的准确性完全取决于手术医师的经验和对二维图像的判读,具有较大的主观性和不准确性[3]。虽然基于CT的计算机辅助导航技术可以提高螺钉置入的准确率[4-5],但存在成本高、操作复杂、辐射暴露等缺点。
随着超声技术的发展,有研究者将超声技术应用于椎弓根螺钉置入手术中,如超声图像融合配准[6]、钉道图像超声识别[7]、超声松质骨成像[8]等。与CT相比,超声设备体积小、重量轻、价格低廉,便于医师以更快的速度和更低的成本获取所需要的信息。前期有较多文献报道了使用超声进行椎弓根螺钉钉道完整性判读的方法[9-11],然而术中图像的判读需要具备一定超声诊断经验的医师进行,且较易产生误判。基于人工智能的计算机辅助诊断技术不仅可以从超声图像中识别出所需的客观指标,代替人眼对图像进行判读和识别,而且能够在人眼难以判断的情况下辅助医师做出更准确的判读。
脊柱椎弓根螺钉钉道骨超声图像为判断钉道的完整性提供了很多有用的特征,这些特征可以在支持向量机(support vector machine,SVM)模型的帮助下对超声图像进行分类。本研究首先采用图像处理的方式提取在脊柱标本上预建立的椎弓根螺钉钉道的超声图像特征,然后基于提取的特征使用SVM模型对钉道底部是否破损进行二分类判断。
1 材料和方法
1.1 材料与仪器
4例新鲜尸体胸腰椎标本由海军军医大学(第二军医大学)基础医学院解剖学教研室提供,男、女各2例,年龄为59~85(73.14±9.87)岁。整个实验方案得到了海军军医大学(第二军医大学)第一附属医院伦理委员会审批。预建立椎弓根螺钉钉道共50个,使用20 MHz超声换能器(型号UM-S20-17S,直径1.7 mm,日本Olympus公司)对预建立的钉道底部进行超声检查并采集图像,使用CT仪(型号Aquilion ONE,日本Canon医疗系统有限公司)对预建立的钉道进行完整性评估。
1.2 研究方法
整体流程图见图 1。由3名具有5年以上脊柱外科工作经验的医师(2名主治医师、1名副主任医师),结合钉道实际探测、CT图像和钉道超声图像特点对钉道完整性和超声图像进行分类。首先由其中2名主治医师各自独立完成,如果2名医师意见存在分歧则由副主任医师裁决,分类过程中排除重叠、不清晰的超声图像。判断为钉道完整的样本被定义为正样本,钉道破损的样本被定义为负样本。最终在得到的样本(1 000个正样本和800个负样本)中随机选取正、负样本各400个用于实验,采用五折交叉验证的方法对样本进行数据增强,最终得到样本集。
采用SVM模型对获得的超声图像样本集进行钉道是否破损的二分类判断,其中正样本如图 2A所示。负样本根据破损程度分为2级:(1)容易被误判为正样本的负样本,即破损不严重的样本(图 2B);(2)可以准确判断的负样本,即破损较为严重的样本(图 2C)。与破损不严重的负样本、正样本相比,破损较为严重的负样本纹理清晰和规则程度较低,且不易描述;破损不严重的负样本与正样本均有清晰且规律的纹理,但是在破损不严重的负样本中,声波会通过破损的钉道壁在钉道外形成声波反射,表现为离中央反射区较远的区域有白色前景(图 2D)。
基于纹理特征分析有可能将破损较为严重的负样本与正样本、破损不严重的负样本区分开,因此首先提取图像纹理特征作为第一类特征并进行初始分类。考虑到仅使用纹理特征难以区分破损不严重的负样本和正样本,引入灰度分布分析得到用于区分前景和背景的阈值T;再做椎弓根螺钉钉道的同心圆(直径为椎弓根螺钉钉道的直径),该同心圆的判别半径通过设计的损失函数得到;最后提取同心圆外部图像的一维统计特征作为第二类特征并进行二次分类。
1.2.1 图像预处理
(1)图像裁剪:为了避免超声图像中非样本超声影像部分对后续处理的影响,同时减少计算负载,将尺寸为1 920像素×1 080像素的原始超声图像(图 3A)利用裁剪函数裁剪成尺寸为789像素×761像素的图像,仅保留样本超声图像区域(图 3B)。(2)图像增强:为了扩大图像中前景和背景的区分度,使用灰度变换函数将图像I中的灰度值映射到图像J中的新值以实现图像增强,表达式为
|
(1) |
其中,I表示要处理的图像,J表示增强后的图像。同时,图像增强也可以改善图像质量、丰富信息量、增强对比度、加强图像判读和识别效果(图 3C)。(3)确定圆心位置:在该数据集中,所有超声图像的设置均保持一致,因此所有图像的圆心位置均相同(图 3D、3E),以图形左上角顶点为坐标原点,圆心坐标均为(411,381)。
1.2.2 第一类特征提取与初始分类
在第一类特征提取前,需要得到超声图像的灰度共生矩阵,大小设为L×L,即灰度共生矩阵的灰度级别为L。由于超声图像的生成角度、灰度级都会对灰度共生矩阵的构造产生影响,因此需要先确定灰度共生矩阵的生成角度及灰度级。(1)生成角度选取:为了避免在构造灰度共生矩阵的过程中丢失纹理特征信息,选取0°、45°、90°、135° 4个角度上纹理特征参数的平均值作为第一类特征提取所需的特征参数。(2)灰度级选取:为了保持像素灰度级不变,同时减少运算量,将灰度归一化至8个量级。(3)特征参数选取:通过得到的灰度共生矩阵,提取图像的纹理特征参数作为第一类特征参数。选取角二阶矩(angular second moment,ASM)和逆方差(inverse different moment,IDM)描述脊骨超声图像的纹理特征,表达式分别为
|
(2) |
|
(3) |
其中,P(i,j)是生成的大小为L×L的灰度共生矩阵中的元素,i、j分别表示灰度共生矩阵中第i行、第j列,L表示灰度共生矩阵的灰度级别。将ASM和IDM作为初始分类模型搭建2个特征参数。
1.2.3 第二类特征提取与二次分类
在第二类特征提取前,首先获得阈值T以区分前景和背景;然后做椎弓根螺钉钉道的同心圆,该同心圆的半径通过损失函数计算获得;最后将同心圆外部图像的一维统计特征作为特征参数进行二次分类。(1)阈值T的选取:以图 3D、3E为例介绍阈值T的计算过程,图像中前景部分占图像的像素比例较低,故对图像求解获得灰度直方图(图 4A、4B)。Pi(i∈(0, 255))表示灰度值为i的像素数量,若i=255则表示图像中灰度值在0~255之间的所有像素数量,也等于图像中的像素总数,即
|
(4) |
在超声图像中,前景分布在灰度级较高的部分,故选取灰度直方图后10%作为前景,即T=x,灰度值>x则表示该像素为前景,x满足
|
(5) |
为了使阈值T对所有超声图像均表现出良好的适应性,计算所有超声图像的阈值T并求平均值,即
|
(6) |
其中n表示第n个样本。
(2)半径R的选取:对于数据集中所有的超声图像,统计在以坐标(411,381)为圆心、半径为R的同心圆内灰度值超过阈值T的像素点数量,以及整张超声图像中灰度值超过阈值T的像素点数量,计算两者的比值,记作Ra(ratio),其中正样本的比值为Ra+,负样本的比值为Ra-,表达式分别为
|
(7) |
|
(8) |
|
(9) |
其中,i、j分别表示单张图像中第i行、第j列,x(i, j)表示第i行、第j列个像素的灰度值,n表示第n个样本。取90%作为判定界限,Ra≥90%判定为钉道完整,Ra<90%则判定为钉道破损,记作I(n),表达式为
|
(10) |
在该数据集的正样本中有x1个样本满足Ra+≥90%,负样本中有x2个样本满足Ra-≥90%,定义损失函数L及正样本损失函数L+、负样本损失函数L-,并调整半径R使L+-L-达到最大值,表达式分别为
|
(11) |
|
(12) |
|
(13) |
|
(14) |
当L达到最大值时表明此时的半径对该数据集钉道完整性判断的准确度达到最佳。
(3)一维统计特征:为了使所有超声图像的灰度级为同一量级、消除指标之间的量纲影响,首先对超声图像进行归一化处理,再提取同心圆外图像的一维统计特征作为第二类特征参数。选取熵、方差、对比度、能量、平均绝对偏差5个参数作为一维统计特征,进行二次分类模型的搭建。
1.3 统计学处理
采用准确度、特异度、灵敏度、F1值、假正率、假负率对分类结果进行评估:准确度=(TP+TN)/(TP+TN+FP+FN),特异度=TN/(FP+TN),灵敏度(召回率)=TP/(TP+FN),F1值=2×精确率×召回率/(精确率+召回率),假正率=FP/(FP+TN),假负率=FN/(TP+FN),其中精确率=TP/(TP+FP),TP表示真阳性样本数,TN表示真阴性样本数,FP表示假阳性样本数,FN表示假阴性样本数。
2 结果
第一类特征提取后初始分类结果显示,真阳性样本数为326,真阴性样本数为272,假阳性样本数为128,假阴性样本数为74。五折交叉验证结果(表 1)显示,初始分类的准确度为74.75%,特异度为68.00%,灵敏度为81.50%,F1值为76.35%,假正率为32.00%,假负率为18.50%。在二次分类前,计算得到阈值T为37。在不同半径R下x1、x2、L、L+、L-如图 5所示,得到最佳半径R为108像素。第二类特征提取后二次分类结果显示,真阳性样本数为390,真阴性样本数为364,假阳性样本数为36,假阴性样本数为10。五折交叉验证结果(表 1)显示,二次分类的准确度为94.25%,特异度为91.00%,灵敏度为97.50%,F1值为94.43%,假正率为9.00%,假负率为2.50%。
表 1
(Tab 1)
表 1 第一类特征提取后初始分类及第二类特征提取后二次分类的五折交叉验证结果
Tab 1 Five-fold cross-validation results of initial classification after type 1 feature extraction and secondary classification after type 2 feature extraction
Test times |
Initial classification |
| Secondary classification |
TP |
TN |
FP |
FN |
| TP |
TN |
FP |
FN |
1 |
117 |
0 |
0 |
43 |
| 155 |
0 |
0 |
5 |
2 |
51 |
61 |
44 |
4 |
| 52 |
103 |
2 |
3 |
3 |
46 |
79 |
32 |
3 |
| 49 |
111 |
0 |
0 |
4 |
112 |
20 |
4 |
24 |
| 134 |
20 |
4 |
2 |
5 |
0 |
112 |
48 |
0 |
| 0 |
130 |
30 |
0 |
TP: True positive; TN: True negative; FP: False positive; FN: False negative. |
|
表 1 第一类特征提取后初始分类及第二类特征提取后二次分类的五折交叉验证结果
Tab 1 Five-fold cross-validation results of initial classification after type 1 feature extraction and secondary classification after type 2 feature extraction
|
3 讨论
超声检查可实时评估椎弓根螺钉置入手术过程中钉道的完整性,能够及时发现破损钉道,降低手术风险,具有较好的应用前景。与CT等医学影像学技术相比,超声检查操作简单、实时性更高、无电离辐射。本研究提出了一种基于超声图像智能分析的椎弓根螺钉钉道完整性评估方法,该方法首先将纹理特征作为第一类特征对超声图像特征进行初始分类,筛选出椎弓根螺钉钉道破损严重的超声图像,再选取熵、方差、对比度、能量、平均绝对偏差5个参数作为第二类特征,对超声图像进行二次分类。
实验结果表明,在采集的800个样本中,二次分类的总体准确度为94.25%,特异度为91.00%,灵敏度为97.50%,F1值为94.43%,假正率为9.00%,假负率为2.50%。二次分类在初始分类的基础上,分类准确度提高了19.5%,具有较好的检测性能。分类准确度提高的原因有以下几点:(1)初始分类仅通过纹理特征筛选出椎弓根螺钉钉道破损严重的超声图像,但是破损的样本包括破损严重的样本和轻微破损的样本,仅通过纹理特征分类的准确度较低;(2)二次分类是在初始分类的基础上进行的,并且将熵、方差、对比度、能量、平均绝对偏差5个参数作为第二类特征进行分类,由于在图像中提取了更多的特征,因此有更高的分类准确度。
在第二类特征提取与二次分类前得到半径R为108像素的同心圆,通过计算同心圆内外灰度值超过阈值T的像素点数量的比例是否超过判定界限90%的方法来判断椎弓根螺钉钉道是否破损是不可行的,因为该方法是在已知椎弓根螺钉钉道是否破损的情况下得到同心圆的半径。同时为了便于计算机处理与分类,本研究采用的超声图像均来自钉道底部。同时,钉道同心圆的半径R取108像素并非一个标准参数,而是通过设计的损失函数得到的最佳值。在理想情况下,该同心圆的半径与钉道半径保持一致。但是在实际情况下,判定同心圆的半径与超声探头是否达到洞底、声波在松质骨内传播的距离、超声设备发射的声波频率和能量等有关,且由于不同患者的骨密度不同也会导致钉道的具体形态存在差异,从而影响了分类的准确度。因此,可以通过对大量超声图像进行综合处理建立一个半径的综合极限值,提高分类准确度。
在实际情况下,仅通过1张图像无法判断椎弓根螺钉钉道底部是否破损,需要对同一例患者的钉道进行多次不同方向的超声扫描,再对多张超声图像进行多次判断才能得到一个准确的结果,这点也需要在实际操作中注意。
本研究有以下局限性:(1)本研究采用的数据集包含800个样本,样本量基本满足机器学习的要求,但是后续仍需扩大病例数量及样本数量以提高模型的泛化能力,同时本研究提取的图像特征只有7个,后续实验可以通过增加数据量、利用影像组学提取特征等进一步对特征进行降维处理。(2)椎弓根螺钉钉道的破损情况在不同个体中表现各不相同,未来工作中可以利用深度学习对破损等级进行多级分类。
超声检查在椎弓根螺钉置入手术中给医师带来了很大帮助,计算机自动辅助判断钉道的完整性也方便了超声技术的临床应用,无须依赖专业医师对图像进行判断和解释,给超声图像判读经验较为欠缺的医师带来了极大的便利。