松弛分布一致性的半监督医学图像分割

孙锐 麦华煜 李徵 刘瑜 何友

孙锐, 麦华煜, 李徵, 等. 松弛分布一致性的半监督医学图像分割 [J]. 智能系统学报, 2026, 21(1): 132-145. doi: 10.11992/tis.202507034
引用本文: 孙锐, 麦华煜, 李徵, 等. 松弛分布一致性的半监督医学图像分割 [J]. 智能系统学报, 2026, 21(1): 132-145. doi: 10.11992/tis.202507034
SUN Rui, MAI Huayu, LI Zhi, et al. Relaxed distribution-wise consistency for semi-supervised medical image segmentation [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 132-145. doi: 10.11992/tis.202507034
Citation: SUN Rui, MAI Huayu, LI Zhi, et al. Relaxed distribution-wise consistency for semi-supervised medical image segmentation [J]. CAAI Transactions on Intelligent Systems, 2026, 21(1): 132-145. doi: 10.11992/tis.202507034

松弛分布一致性的半监督医学图像分割

doi: 10.11992/tis.202507034
基金项目: 国家自然科学基金项目(62425117, 62401335).
详细信息
    作者简介:

    孙锐,助理研究员,主要研究方向为计算机视觉与机器学习,尤其聚焦于视频理解、半监督学习与多模态大模型。发表学术论文30余篇,其中CCF-A类期刊/会议20余篇。E-mail:issunrui@mail.ustc.edu.cn;

    刘瑜,研究员,博士生导师,国家杰出青年基金获得者,中国青年科技奖获得者,主要研究方向为多模态数据智能融合。发表学术论文80余篇,获专利授权50余项,登记软件著作权20余项。E-mail:liuyu_thu@mail.tsinghua.edu.cn;

    何友,中国工程院院士,兼任中国人工智能学会副理事长、中国航空学会名誉副理事长、中国指挥与控制学会监事长等。主要研究方向为信号检测、信息融合、智能技术与应用。以第一完成人获4项国家科技进步二等奖,荣获何梁何利基金科学与技术进步奖、“求是”工程奖、全国留学回国人员成就奖、山东省科学技术最高奖等。E-mail: heyou@mail.tsinghua.edu.cn.

    通讯作者:

    刘瑜. E-mail:liuyu_thu@mail.tsinghua.edu.cn.

  • 中图分类号: TP391

Relaxed distribution-wise consistency for semi-supervised medical image segmentation

  • 摘要:

    半监督医学图像分割可有效缓解医学图像标注成本高、效率低的问题,然而,医学图像中蕴含的丰富像素间相关性尚未被有效利用,影响了伪标签的可靠性。针对这一问题,本文分析了传统像素级一致性正则化方法在处理像素间结构关系时的局限性导致的性能瓶颈,提出一种融合像素间相关性的松弛分布一致性(relaxed distribution-wise consistency,RDC)方法。设计正交选择策略以选取代表性特征代理,通过分布一致性约束实现像素–代理相关性分布对齐,补充了传统像素级一致性监督;提出了排序对齐策略,松弛严格的分布数值对齐,从而提升了方法对噪声的鲁棒性。在ACDC、LA和Pancreas-NIH共3个公开数据集上的实验结果表明,RDC方法性能明显优于现有先进的半监督医学图像分割方法。本文研究结果可为半监督医学图像分割中未标注数据的利用策略设计提供新的思路与参考。

     

    Abstract:

    Semi-supervised medical image segmentation effectively alleviates the challenges of high annotation costs and inefficiencies in clinical settings. However, the rich interpixel correlations in medical images have not been fully exploited, which can reduce the accuracy and reliability of pseudo-labels used for training. To address this limitation, this work analyzes the limitations of conventional pixel-wise consistency regularization and proposes a relaxed distribution-wise consistency(RDC) method that integrates interpixel correlations. First, an orthogonal selection strategy is designed to construct representative feature agents. The distribution-wise consistency then aligns the pixel–agent correlations across augmentation views. Second, a ranking alignment strategy is employed to relax strict value-wise alignment, thereby increasing robustness to noise. Experiments on three challenging public datasets—ACDC, LA, and Pancreas-NIH—show that the proposed RDC method outperforms existing semi-supervised medical image segmentation methods. These findings provide new insights and references for designing effective strategies to exploit unlabeled data in semi-supervised medical image segmentation.

     

  • 医学图像分割旨在从诸如计算机断层扫描(computed tomography, CT)或磁共振成像(magnetic resonance imaging, MRI)等结构性医学影像中精确识别出特定的解剖结构,是自主手术机器人[1]、增强现实辅助手术[2]等多种临床下游应用的关键技术基础。近年来,随着深度神经网络(deep neural networks, DNN)的迅猛发展,医学图像分割的精度已达到前所未有的水平。然而,深度学习模型的数据驱动特性决定了其性能高度依赖于大规模、高质量的像素级标注数据。在医学领域,获取此类标注不仅需要深厚的专业知识,工作量大、耗时长且成本高昂,制约了模型性能的进一步提升。

    为缓解标注数据不足的问题,近年来的研究逐渐转向半监督医学图像分割(semi-supervised medical image segmentation, SSMIS)[3-10]。该类方法通过联合利用有限的标注样本与大量未标注图像训练模型,从而降低对人工标注的依赖。在现有方法中,伪标签学习范式[11]被广泛采用,通常构建在教师–学生框架(teacher-student framework)之上[12]。具体而言,对于同一未标注图像,学生网络在强增强条件下的预测结果需与教师网络在弱增强条件下的输出保持一致,并以此构建像素级一致性正则化,作为对未标注数据的监督信号。

    现有像素级一致性正则化方法大致可归纳为软伪标签范式与硬伪标签范式两种主流范式。软伪标签范式保留模型输出的所有类别预测概率作为伪标签,即类别后验分布,并通过诸如KL (kullback-leibler)散度[13]等损失函数度量学生网络与教师网络预测结果之间的偏差。然而,在医学图像中,前景与背景之间的对比度通常较低,结构边界模糊,直接对齐软伪标签分布在此类场景下的鲁棒性较差。例如,对于心肌等体积小、边界模糊的结构,其类别概率容易被背景或相邻组织的噪声干扰[14],从而降低伪标签的可靠性,进而影响模型学习。相比之下,硬伪标签范式仅选择具有最高置信度的类别作为伪标签[15],忽略其余类别概率,在一定程度上具备更强的抗噪性。其有效性可由最小描述长度(minimum description length, MDL)原理解释[16],通过保留高度确定的预测结果,可以有效地减少伪标签中冗余或不确定的信息。

    尽管硬伪标签范式在鲁棒性方面表现更佳,但此类方法普遍存在一个核心局限:它们仅关注于个体像素级别的预测一致性,忽略了医学图像中蕴含的丰富像素间相关性信息。与自然图像相比,医学图像常具有低对比度、边界模糊以及解剖结构之间紧密相邻的特点。以心脏MRI图像分割为例,心肌区域不仅边界模糊,且常呈现为面积较小、形状不规则的环状结构,但其复杂的像素间邻接关系恰恰构成了可供利用的宝贵结构先验信息,区域内的相邻像素通常语义一致,且与周围心腔区域存在稳定的对比关系。然而,传统的个体像素级一致性方法通常基于单点像素的预测进行监督,忽略了像素间的相关性信息,导致有效的监督信号不足,从而影响模型的学习效果和分割精度。总的来说,此类像素间相关性信息对半监督医学图像分割至关重要,其本质上契合该任务的核心目标,最大化挖掘密集未标注像素所携带的潜在信息。过度依赖孤立的个体像素级监督,不仅会增加伪标签出错的风险,还可能引发确认偏误问题[17],即模型在整个训练过程中不断学习自身生成的有偏伪标签,导致初始微小误差被逐步累积放大,最终导致模型陷入性能退化的恶行循环。为此,亟需构建一种能够有效利用像素间相关性信息的监督信号,以突破现有个体像素级一致性监督所带来的性能瓶颈。

    本文针对现有像素级一致性监督存在的性能瓶颈问题,提出了一种融合像素间相关性的松弛分布一致性 (relaxed distribution-wise consistency,RDC)方法,作为对传统像素级一致性监督的补充。该方法的核心思想是引入一组具有代表性的参考特征,称为代理,以建模医学图像中广泛存在的像素间相关性关系。对于任意来自弱增强和强增强的像素,通过与该组代理之间的相似性计算,可分别获得其对应的像素–代理相关性分布(即相似度向量)。本质上,像素与代理之间的相关性刻画了代理特征在更大感受野范围内对该像素的语义共识程度,即语义空间中的相对可比较性。基于这一建模方式,弱增强和强增强下的同一像素不仅应在单点预测结果上保持一致(即传统的个体像素级一致性),还应在其与所有代理之间的相关性分布上保持一致性,即分布级一致性,来更有效地适应医学图像中的密集像素预测任务。

    尽管该建模方式有助于引入像素间相关性的约束,但在训练过程中如何选取合适的代理仍是一项挑战。直观而言,所选代理应能够与医学图像中覆盖广泛语义对比度的像素保持良好的响应关系,从而捕捉多样化的语义信息。为此,本文设计了一种正交选择策略(orthogonal selection strategy,OSS),从所有像素特征中挑选出最具代表性的特征作为代理。该策略旨在尽可能保留原始像素中的关键语义信息,并赋予代理恢复潜在干净结构的能力。所构建的代理不仅能够更充分地建模像素间相关性,还有效弥补了传统个体像素级一致性监督的局限。

    尽管基于分布级一致性构建监督信号最直接的方式是采用诸如KL散度等损失函数,但该方式仍存在关键问题。与传统的像素级一致性不同,后者可借助标注样本的真实标签作为可靠支撑,而分布级一致性则完全依赖于数据驱动的无监督优化,其数值本身的可靠性相对较低。为缓解该问题,本文进一步提出了排序对齐策略(ranking alignment strategy),将严格的分布数值对齐过程松弛为排序对齐,从而增强模型对噪声的鲁棒性。其基本出发点在于,尽管相关性分布中的具体数值可能受到噪声扰动而产生偏差,但其相对排序通常具有更强的稳定性。基于此,RDC通过约束教师网络和学生网络之间像素–代理相关性分布的排序一致性,从而构建更加有效和完整的监督信号,进一步挖掘了未标注数据中所蕴含的潜在语义知识。

    本文的主要贡献总结如下:

    1) 针对现有像素级一致性监督在半监督医学图像分割中的性能瓶颈,本文分析其忽略像素间相关性的问题,提出结合像素间相关性以构建更可靠监督信号的必要性。

    2) 本文提出松弛分布一致性方法RDC,包括正交选择策略以构造代表性特征代理,并通过分布级一致性约束实现像素–代理相关性分布的一致对齐。进一步地,设计排序对齐策略,将严格的数值对齐松弛为排序对齐,增强方法对噪声的鲁棒性。

    3) 在ACDC、LA和Pancreas-NIH这3个具有挑战性的公开医学图像分割数据集上开展对比和消融实验,结果表明所提出的RDC方法性能明显优于现有先进的半监督医学图像分割方法。

    医学图像分割是计算机视觉与医疗图像分析中的核心任务,旨在从CT、MRI等结构性医学影像中精确识别出特定的解剖区域,为临床辅助诊断、术前规划和术中导航等提供基础支持[18]。早期研究主要依赖基于边缘[19]、区域或图模型的手工特征进行分割[20-21],但这类方法对图像质量与结构变化敏感,难以适应复杂或变异较大的临床场景。随着深度学习的发展[22-25],数据驱动的医学图像分割方法迅速成为主流,催生了大量结构设计精巧的卷积神经网络(convolutional neural network, CNN)模型[26-27]。其中,U-Net[26]凭借其对称的编码–解码架构和跳跃连接机制,在多个医学图像分割任务中取得显著成效,成为当前最广泛应用的基线模型。其后续版本nnU-Net[27]进一步系统化地优化了数据预处理流程、网络结构配置、训练策略和后处理方法,具备良好的跨数据集自适应能力,在多个挑战性场景上取得领先性能。当前,医学图像分割模型的研究可从以下3个方面展开:1) 数据层面:模型性能高度依赖于数据质量和多样性。nnU-Net[27]强调了归一化、重采样和裁剪等标准化预处理流程的重要性;Xu等[28]则引入多样化的数据增强策略(如仿射变换、光照扰动、伪随机噪声等),以提升模型在少标注样本条件下的泛化能力和鲁棒性。2) 网络结构层面:之前的工作尝试通过重构网络连接、引入上下文感知机制以提升模型表达能力。例如,UNet++[29]通过重新设计跳跃连接路径实现多尺度语义融合;Wang等[30]通过建模全局像素依赖关系,有效提升了上下文理解能力;此外,Transformer结构因具备全局建模能力,已被广泛应用于医学图像分割任务,如TransUNet[31]、Swin-UNet[14]等架构,缓解了CNN的感受野局限与归纳偏置问题。3) 损失函数设计:合理的损失函数设计对于提升模型分割性能至关重要。Liu等[32]提出了基于Tversky Loss的区域类损失,更关注全局预测与标注区域的一致性;Karimi等[33]提出了基于Hausdorff距离边界类损失来专注于轮廓边缘建模,适用于对结构精度要求高的任务;此外,Wong等[34]提出Compound Loss用于权衡整体准确性与局部精度。尽管现有全监督方法在医学图像分割任务上取得了优异结果,但仍高度依赖于像素级的精细标注数据,而医学影像的专业性和复杂性导致标注成本极高。因此,半监督医学图像分割逐渐成为当前研究的热点方向,以期在减少人工标注的前提下保持令人满意的分割精度。

    为了减少对高成本像素级标注数据的依赖,近年来半监督医学图像分割成为研究热点。其中,一致性正则化(consistency regularization)范式[35]因其实现简洁且表现优异,被广泛应用于各类半监督医学图像分割方法中[3-10]。这类方法通常采用教师–学生框架,即以教师网络在弱增强视图下的预测作为伪标签,引导学生网络在强增强视图下的预测保持一致性,从而实现对无标签样本的有效利用。为提升伪标签质量与一致性约束的有效性,已有研究从多个角度对该范式进行扩展。例如,UA-MT[36]引入不确定性建模机制,根据模型对伪标签的置信度动态调整监督强度;Su等[37]构建具有形状感知的基于双任务的交叉损失,提升伪标签轮廓边缘的分割精度;Fang等[3]提出双模型交互学习方法引入像素稳定性判断机制, 从而矫正伪标签;DTC[9]构建任务层级一致性损失,提升模型跨任务泛化能力;MCF[10]显式建模模型预测偏差,引导学生网络自我校正;M-CnT[13]提出类内一致性约束策略以压缩类内特征分布,提高区分性;UMCT[38]则基于多视角输入设计多分支结构,通过多视角聚合生成更鲁棒的伪标签。尽管上述方法在提高像素级伪标签可靠性方面取得了一定进展,但其共同局限在于,多数方法仍仅关注于个体像素层面的点对点一致性监督,忽视了医学图像中蕴含的像素间相关性信息。而此类像素间相关性信息对半监督医学图像分割至关重要,对于提升模型对伪标签噪声的容忍度具有重要意义。与这些方法不同,本文的核心目标是填补这一空白。本研究不局限于个体像素级一致性监督,而是尝试将像素间相关性显式地融入到一致性框架中,通过提出的松弛分布一致性方法RDC,从高阶相关性层面有效突破了传统个体像素级一致性监督的性能瓶颈,进一步提升了对未标注数据的利用效率。

    本节首先在预备知识部分介绍半监督医学图像分割任务中经典的教师–学生框架,并从像素间相关性的视角引出本文所提RDC方法的核心思想。随后,将详细阐述如何构建像素–代理相关性分布以挖掘未标注数据中更可靠的信息。最后,将介绍本文设计的松弛分布一致性方法,提出排序对齐策略将严格的数值对齐松弛为排序对齐,增强方法对噪声的鲁棒性。总体动机示意如图1所示。

    图  1  本文方法的动机示意
    Fig.  1  Illustration of our motivation
    下载: 全尺寸图片

    在SSMIS任务中,给定一个已标注数据集$ {{D}}^{l}=\{(\boldsymbol{x}_{i}^{l},\boldsymbol{y}_{i}^{l})\}_{i=1}^{{N}^{l}} $和一个规模远大于$ {N}^{l} $的未标注数据集$ {{D}}^{u}=\{\boldsymbol{x}_{i}^{u}\}_{i=1}^{{N}^{u}} $,其中$ {N}^{u}\gg {N}^{l} $,其目标是利用这些数据训练一个高性能的分割模型。主流的教师–学生框架由一个教师网络$ {f}_{T}\left(\cdot ;{\theta }_{T}\right) $和一个学生网络$ {f}_{S}\left(\cdot ;{\theta }_{S}\right) $构成。

    学生网络受到两部分监督信号指导:一是来自有标注数据的真实标签;二是来自教师网络为未标注数据生成的伪标签。学生网络的参数通过梯度反向传播进行更新,而教师网络的参数则通过学生网络参数的指数移动平均(exponential moving average, EMA)进行更新,即

    $$ {\theta }_{T}=m{\theta }_{T}+(1-m){\theta }_{S} $$

    式中$ m $为动量系数。为简化说明,以2D医学图像为例。对于已标注数据,有监督损失$ {L}_{\sup } $定义为标准的像素级交叉熵损失。

    $$ {L}_{\sup }=\frac{1}{{N}^{l}}\sum\limits_{i=1}^{{N}^{l}}\frac{1}{HW}\sum\limits_{j=1}^{HW}{l}_{{\mathrm{CE}}}\left(\boldsymbol{y}_{ij}^{l},{f}_{S}{\left(\boldsymbol{x}_{i}^{l}\right)}_{j}\right) $$ (1)

    式中$ H $和$ W $分别为医学图像的高度和宽度。对于未标注数据,教师网络以弱增强视图$ \mathrm{aug}(\boldsymbol{x}_{i}^{u}) $作为输入,并为学生网络生成伪标签$ \hat{{\boldsymbol{y}}} _{i}^{u} $。

    $$ \hat{\boldsymbol{y}}_{i j}^u= \left\{\begin{gathered} \arg \max f_T\left({{\mathrm{aug}}}\left(\boldsymbol{x}_i^u\right)\right)_j, \qquad c_{i j}^u \gt \gamma \\ 忽略, \qquad \text{ 其他 } \\ \end{gathered}\right. $$ (2)

    式中$ c_{ij}^u=\max f_T(\mathrm{au}\mathrm{g}(x_i^u))_j $为教师网络对于第$ i $个图像的第$ j $个像素的置信度,为排除不可靠的预测,通常会设定一个置信度阈值$ \gamma $。只有当教师网络对于像素的预测置信度$ c_{ij}^{u} $高于该阈值时,其对应的类别才会被采纳为伪标签。由此,可以构建像素级一致性正则化损失$ {L}_{\mathrm{reg}} $为

    $$ {L}_{\mathrm{reg}}=\frac{1}{{N}^{u}}\sum\limits_{i=1}^{{N}^{u}}\frac{1}{HW}\sum\limits_{j=1}^{HW}{l}_{\mathrm{CE}}\left(\hat{{\boldsymbol{y}}} _{ij}^{u},{f}_{S}{\left({{\mathrm{Aug}}}\left(\boldsymbol{x}_{i}^{u}\right)\right)}_{j}\right) $$ (3)

    式中$ {{\mathrm{Aug}}}(\cdot ) $表示强数据增强。通过施加一致性正则化约束,如图1(a)所示,模型可以从未标注数据挖掘可依赖的信息。最终,总体的损失为$ L={L}_{\sup }\text{+}{L}_{\mathrm{reg}} $。然而,上述一致性正则化是在个体像素级别上进行的,忽略了医学图像中蕴含的丰富像素间相关性信息。因此,本文的核心关注点在于如何有效利用像素间的相关性,构建超越传统像素级一致性的监督信号。接下来,将详细介绍像素间相关性建模的过程。

    为了从未标注数据中挖掘出更可依赖的信息,除传统的像素级一致性约束外,引入基于像素间相关性的正则化建模被认为是一种更具深度的策略,能够弥补个体像素监督的局限性。然而,若直接对所有像素对之间的相关性(即自相关矩阵)进行一致性约束,则容易引入大量噪声,特别是在教师网络与学生网络之间强制保持全局一致性,会干扰模型优化过程,最终导致次优性能。因此,本文避免直接使用全像素自相关一致性建模。

    为更有效地引导模型学习像素间结构关系,本文提出了基于代理点的像素–代理相关性建模方法。具体地,通过引入一组具有代表性的参考特征,称为代理,以构建每个像素与这组代理之间的相似性关系。本质上,像素与代理之间的相关性刻画了代理特征在更大感受野范围内对该像素的语义共识程度,即语义空间中的相对可比较性。

    为实现上述目标,本文设计正交选择策略,在图像中动态选取一组信息丰富、分布广泛的代理点。具体而言,首先从未标注图像$ \boldsymbol{x}_{}^{u} $中提取像素特征$ \boldsymbol{F}\in {\bf{R}}^{C\times H\times W} $,该特征位于分割模型的线性分类器前;随后,依据最小余弦相似度原则,从图像像素特征$ \boldsymbol{F} $中迭代构建包含$ N $个代理点的集合$ \boldsymbol{A}=\{\boldsymbol{f}_{i}^{a}\}_{i=1}^{N}\in {\bf{R}}^{C\times N} $,确保每个新选代理与已选代理尽可能正交,从而增强对医学图像的多样性覆盖。该过程从随机选取的初始像素开始,持续迭代至选满$ N $个代理点,算法具体流程如算法1所示。该贪婪策略具备动态性,可基于当前图像特征自适应选择代理,有效保留原始图像中的关键语义信息。

    算法1 正交选择策略

    输入 像素特征$ \boldsymbol{F}\in {\bf{R}}^{C\times H\times W} $,目标代理数量$ N $

    输出 代理点集合$ \boldsymbol{A}=\{\boldsymbol{f}_{i}^{a}\}_{i=1}^{N}\in {\bf{R}}^{C\times N} $

    1)$ \boldsymbol{F}\leftarrow \boldsymbol{F}.\mathrm{reshape}(C\times HW) $ ▷展平为二维序列

    2)$ \boldsymbol{A}\leftarrow \mathrm{random}\_ \mathrm{select}(\boldsymbol{F}) $ ▷随机初始化一个代理特征

    3) $ \text{for }i\in [1,N-1]\text{ do} $

    4)$ \boldsymbol{F'}\leftarrow \{\boldsymbol{f}\mid \boldsymbol{f}\in \boldsymbol{F},\boldsymbol{f}\notin \boldsymbol{A}\} $  ▷形成候选特征集

    5) $ \boldsymbol{S}\leftarrow \mathrm{cosine}\_ \mathrm{similarity}(\boldsymbol{F'},\boldsymbol{A}) $  ▷计算相似度

                ▷其中$ \boldsymbol{S}\in {\bf{R}}^{(HW-i)\times i} $

    6) $ \boldsymbol{S}\leftarrow \max (\boldsymbol{S},\dim =1) $ ▷候选特征的最大相似度

    7) $ \text{index}\leftarrow \arg \min (\boldsymbol{S}) $ ▷选取最正交的候选特征

    8) $ \boldsymbol{a}\leftarrow \boldsymbol{F}.\mathrm{select}(\text{index}) $  ▷根据索引获得代理

    9)$ \boldsymbol{A}\leftarrow \boldsymbol{A}\cup \boldsymbol{a} $  ▷加入代理点集合

    10) end for

    在得到代理集合后,任意像素特征$ \boldsymbol{f}\in {\bf{R}}^{C\times 1} $可与代理点集合$ \boldsymbol{A} $计算其相关性分布(即像素–代理相关性)。

    $$ \boldsymbol{c}=\mathrm{softmax}\left({\boldsymbol{f}}^{\top }\boldsymbol{A}\right) $$

    式中:$ \boldsymbol{c}\in {\bf{R}}^{1\times N} $为该像素与所有代理之间的相似性分布,转置符号$ \top $为矩阵转置。

    在定义上述像素–代理相关性分布后,可进一步在教师网络与学生网络之间引入分布级一致性约束,采用KL散度作为度量指标,对其在相同像素位置的相关性分布差异进行约束,从而实现分布对齐目标。损失函数形式为

    $$ {L}_{\mathrm{dc}}=\frac{1}{{N}^{u}}\sum\limits_{i=1}^{{N}^{u}}\frac{1}{HW}\sum\limits_{j=1}^{HW}{l}_\mathrm{{KL}}\left(\boldsymbol{c}_{ij}^{w},\boldsymbol{c}_{ij}^{s}\right) $$

    式中:$ {N}^{u} $为未标注图像数量,$ l_{\mathrm{KL}} $为KL散度损失,$ \boldsymbol{c}_{ij}^{w} $和$ \boldsymbol{c}_{ij}^{s} $分别为教师与学生网络在第$ i $个图像的第$ j $ 个像素的像素–代理相关性分布,如图1(b)所示。

    与传统的像素级一致性不同,分布级一致性约束不依赖于标注数据提供的真实标签作为可靠支撑,而是完全基于无监督的数据驱动优化方式构建,因此其数值结果常受噪声扰动影响,稳定性较差。尽管相关性分布中具体数值可能受到噪声扰动产生偏差,但其相对排序通常具有更强的稳定性。

    为此,本文在分布一致性层面提出排序对齐策略(ranking alignment strategy),总体流程如图2所示。

    图  2  松弛分布一致性的半监督医学图像分割方法流程
    Fig.  2  Flowchart of the relaxed distribution-wise consistency for semi-supervised medical image segmentation
    下载: 全尺寸图片

    即将原本对像素–代理分布的数值级精确对齐松弛为排序对齐,从而提升约束的鲁棒性,如图1(c)所示,定义为

    $$ {l}_{\mathrm{RK}}\left({\boldsymbol{c}}^{w},{\boldsymbol{c}}^{s}\right)=\sum\limits_{n=1}^{N}\frac{\min \left(\mathcal{R}\left(n,{\boldsymbol{c}}^{w}\right),\mathcal{R}\left(n,{\boldsymbol{c}}^{s}\right)\right)}{\max \left(\mathcal{R}\left(n,{\boldsymbol{c}}^{w}\right),\mathcal{R}\left(n,{\boldsymbol{c}}^{s}\right)\right)} $$

    基于此,最终的松弛分布一致性损失$ {L}_{\mathrm{rdc}} $可以被表达为

    $$ {L}_{\mathrm{rdc}}=\frac{1}{{N}^{u}}\sum\limits_{i=1}^{{N}^{u}}\frac{1}{HW}\sum\limits_{j=1}^{HW}{l}_{\mathrm{RK}}\left(\boldsymbol{c}_{ij}^{w},\boldsymbol{c}_{ij}^{s}\right) $$ (4)

    式中:$ l_{\mathrm{RK}} $为基于排名顺序构建的排序损失函数;$ \mathcal{R}\left(n,\boldsymbol{c}\right) $为在像素–代理分布$ \boldsymbol{c} $中,第$ n $个元素的排名。由于排名操作本身不可导,无法直接采用梯度下降进行优化,因此将其改写为

    $$ \mathcal{R}(n,\boldsymbol{c})=1+\sum\limits_{m\neq n}\mathbb{I}\left\{{\boldsymbol{c}}_{m}-{\boldsymbol{c}}_{n}\right\} $$

    式中:$ \mathbb{I}(\cdot ) $为指示函数,当$ {\boldsymbol{c}}_{m}{ \gt }{\boldsymbol{c}}_{n} $时取值为 1,否则为 0。为了使$ {L}_{\mathrm{rdc}} $可导,本文将指示函数替换为 $ \mathrm{sigmoid} $近似,从而实现排序损失的可微优化。最终,本文的总损失函数构建为

    $$ L={L}_{\sup }+{L}_{\mathrm{reg}}+\lambda {L}_{\mathrm{rdc}} $$ (5)

    式中$ \lambda $为平衡权重超参数。通过引入像素–代理分布的排序一致性约束,所提出的 RDC 方法可提供更全面且有效的监督信号,从而促进更准确的建模数据分布,进一步提升无标签数据的利用效率与分割性能。方法的整体流程如算法2所示。

    算法2 RDC训练伪算法

    输入 标注数据集$ {{D}}^{l}=\{(\boldsymbol{x}_{i}^{l},\boldsymbol{y}_{i}^{l})\}_{i=1}^{{N}^{l}} $,未标注数据集$ {{D}}^{u}=\{\boldsymbol{x}_{i}^{u}\}_{i=1}^{{N}^{u}} $,教师网络$ {f}_{T}\left(\cdot ;{\theta }_{T}\right) $,学生网络$ {f}_{S}\left(\cdot ;{\theta }_{S}\right) $,弱增强$ \mathrm{aug}(\cdot) $,强增强$ \mathrm{A}\mathrm{ug}(\cdot) $

    输出 优化后的学生网络$ {f}_{S}\left(\cdot ;{\theta }_{S}\right) $

    1) for 每一批次$ (\boldsymbol{x}_{i}^{l},\boldsymbol{y}_{i}^{l})\in {{D}}^{l},\boldsymbol{x}_{i}^{u}\in {{D}}^{u} $ do

    2) # 标注数据部分:

    3)计算监督损失$ {{L}}_{\sup } $(式(1))  ▷监督损失

    4) # 未标注数据部分:

    5)使用教师网络$ {f}_{T} $生成伪标签(式(2))

    6)计算像素级一致性损失$ {{L}}_{\mathrm{reg}} $(式(3))

     ▷像素级一致性

    7)使用算法1分别为$ {f}_{T} $和$ {f}_{S} $构造代理点集合

    8)计算松弛分布一致性损失$ {{L}}_{\mathrm{rdc}} $(式(4))

     ▷松弛分布一致性

    9) # 参数更新:

    10)优化总损失$ {L}={{L}}_{\sup }+{{L}}_{\mathrm{reg}}+\lambda {{L}}_{\mathrm{rdc}} $(式(5))

    11)使用梯度反向传播更新学生网络参数$ {\theta }_{S} $

    12) EMA 更新教师网络参数$ {\theta }_{T}\leftarrow m{\theta }_{T}+(1-m){\theta }_{S} $

    13) end for

    3.1.1   数据集说明

    ACDC[39](automated cardiac diagnosis challenge)是自动化心脏诊断挑战赛,旨在完成心脏结构的二维分割任务,包含背景、右心室、左心室和心肌4个不同类别。该数据集包含100名患者的cine-MRI (cine phase-contrast MRI)扫描图像,其中70例用于训练,10例用于验证,20例用于测试。LA[40] (left atrium)是左心房数据集,来自于心房分割挑战赛,包含100例三维钆增强磁共振成像扫描图像及其对应标签,其中80例用于训练,20例用于测试。PancreasNIH[41] 是一个三维数据集,包含82例增强腹部CT容积数据及人工标注,其中62例用于训练,20例用于测试。

    3.1.2   实现细节

    本文遵循先前半监督医学图像分割研究[3-10]的实验设置,分别采用U-Net[26]和V-Net[31] 作为二维数据集ACDC和三维数据集LA、Pancreas-NIH的主干网络。在ACDC数据集上,分割模型的训练批次大小为24,裁剪尺寸为256像素×256像素,迭代次数为30000次。与现有研究一致,在LA和Pancreas数据集上采用批次大小4,训练迭代15000次。LA和Pancreas-NIH数据集的裁剪尺寸分别设为96像素×96像素×96像素和112像素×112像素×80像素。学生模型采用SGD优化器训练[42],学习率采用多项式衰减策略,初始学习率为0.01。教师模型的指数动量$ m $为0.99,默认情况下,二维数据集的置信度阈值$ \gamma $设为0.95,三维数据集设为0.75。强增强$ \mathrm{\mathrm{Aug}}(\cdot) $包括随机颜色抖动、高斯模糊和cutmix[10];弱增强$ \mathrm{aug}(\cdot) $包括随机旋转和翻转。所有实验均在单张 RTX3090上进行。

    3.1.3   评估指标

    为全面评估分割性能,本文采用以下4种常用指标[9]:1)Dice系数(Dice similarity coefficient, DSC):用于衡量预测结果与真实标签之间的重叠程度,数值越高表示分割结果越准确;2)Jaccard指数(Jaccard index):亦称交并比,反映预测区域与真实区域的相似性,与Dice指标相似但更严格;3)95% Hausdorff距离(95HD):表示预测边界与真实边界之间的最大距离的95分位数,用于衡量分割边界的偏差,值越小越好;4)平均表面距离(average surface distance, ASD):表示预测边界与真实边界之间的平均距离,同样用于反映边界一致性,值越小越佳。

    为系统评估所提出RDC方法的性能,本文遵循广泛使用的实验设置,在ACDC数据集的5%和10%标注数据划分、LA数据集的5%和10%标注数据划分以及Pancreas-NIH数据集的10%和20%标注数据划分上进行实验,模拟真实场景中标注数据稀缺的设置。本文与现有先进的半监督医学图像分割方法,包括UA-MT[36]、SASSNet[43]、DTC[44]、URPC[45]、ASE-Net[46]、SS-Net[47]、MC-Net+[10]、PS-MT[32]、MCF[48]、BCP[15]、CauSSL[49]、ABD[9]、M-CnT[50]、Diff-CL[51]、DiffRect[52]行了详尽对比。实验结果如表123所示。其中,各表的第一行表示标注数据划分,如表1中的5%/3xl+67xu表示采用ACDC数据集70例标注数据中的5%作为标注数据,即3例,剩下的67例作为未标注数据。

    表  1  不同半监督医学图像分割方法在ACDC数据集上的定量结果
    Table  1  Quantitative results of different semi-supervised medical image segmentation methods on the ACDC dataset
    方法 5%/3xl+67xu 10%/7xl+63xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    U-Net (只用标注) 47.83 37.01 31.16 12.62 79.41 68.11 9.35 2.70
    UA-MT[36] 46.04 35.97 20.08 7.75 81.65 70.64 6.88 2.02
    DTC[44] 56.90 45.67 23.36 7.39 84.29 73.92 12.81 4.01
    URPC[45] 55.87 44.64 13.60 3.74 83.10 72.41 4.84 1.53
    SS-Net[47] 65.82 55.38 6.67 2.28 86.78 77.67 6.07 1.40
    MC-Net+[10] 62.85 52.29 7.62 2.33 87.10 76.06 6.68 2.00
    PS-MT[32] 86.94 77.90 4.95 2.18 88.91 80.79 4.96 1.83
    CauSSL[49] 89.66 81.79 3.67 0.93
    ABD[9] 88.96 80.70 1.57 0.52 89.81 81.95 1.46 0.49
    M-CnT[50] 88.40 4.40
    BCP[15] 87.59 78.67 1.90 0.67 88.84 80.62 3.98 1.17
    Diff-CL[51] 88.75 79.21 1.56 0.51 89.21 80.98 3.04 1.02
    DiffRect[52] 85.61 77.22 2.84 1.10 87.65 80.89 2.31 0.52
    RDC 90.15 81.87 1.38 0.45 90.78 82.36 1.34 0.41
    注:加黑代表最优性能。
    表  2  不同半监督医学图像分割方法在左心房(LA)数据集上的定量结果
    Table  2  Quantitative results of different semi-supervised medical image segmentation methods on the Left Atrium dataset
    方法 5%/4xl+76xu 10%/8xl+72xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    VNet (只用标注) 52.55 39.60 47.05 9.87 82.74 71.72 13.35 3.26
    UA-MT[36] 82.26 70.98 13.71 3.82 86.28 76.11 18.71 4.63
    DTC[44] 81.25 69.33 14.90 3.99 87.51 78.17 8.23 2.36
    URPC[45] 82.48 71.35 14.65 3.65 85.01 74.36 15.37 3.96
    SS-Net[47] 86.33 76.15 9.97 2.31 88.55 79.62 7.49 1.90
    MC-Net+[10] 83.59 72.36 14.07 2.70 88.96 80.25 7.93 1.86
    PS-MT[32] 88.49 79.13 8.12 2.78 89.72 81.48 6.94 1.92
    BCP[15] 88.02 78.72 7.90 2.15 89.62 81.31 6.81 1.76
    Diff-CL[51] 87.93 79.16 7.04 2.01 90.02 82.78 5.93 1.84
    DiffRect[52] 88.52 79.71 6.96 1.78 89.98 81.74 6.49 1.95
    RDC 89.96 82.07 6.23 1.67 90.85 83.16 5.47 1.58
    注:加黑代表最优性能。
    表  3  不同半监督医学图像分割方法在Pancreas-NIH数据集上的定量结果
    Table  3  Quantitative results of different semi-supervised medical image segmentation methods on the Pancreas-NIH dataset
    方法 10%/6xl+56xu 20%/12xl+50xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    VNet (只用标注)) 55.60 41.74 45.33 18.63 72.38 58.26 19.35 5.89
    UA-MT[36] 66.34 53.21 17.21 4.57 76.10 62.62 10.84 2.43
    DTC[44] 69.21 54.06 17.21 5.95 78.27 64.75 8.36 2.25
    ASE-Net[46] 71.54 56.82 13.33 5.73 79.03 66.57 8.62 2.30
    SS-Net[47] 71.76 57.05 17.56 5.77 79.78 66.32 8.86 2.01
    MC-Net+[10] 70.00 55.66 16.03 3.87 79.37 66.83 8.52 1.72
    PS-MT[32] 76.94 62.37 13.12 3.66 80.74 68.15 7.41 2.06
    BCP[15] 73.83 59.24 12.71 3.72 82.91 70.97 6.43 2.25
    CauSSL[49] 72.89 58.06 14.19 1.66 80.92 68.26 8.11 1.53
    Diff-CL[51] 76.12 62.68 12.01 3.39 82.13 69.47 7.50 2.98
    DiffRect[52] 75.23 62.03 12.39 3.20 82.09 68.99 7.78 3.14
    RDC 80.87 68.13 6.59 1.45 83.26 71.47 4.52 1.35
    注:加黑代表最优性能。

    总体来看,RDC在各项指标上均优于现有的先进方法,充分验证了本方法的有效性。

    3.2.1   ACDC数据集实验结果

    表1给出了在ACDC数据集上不同方法的对比结果。该数据集主要面向心脏结构的二维分割任务,具有结构体积差异大、边界模糊等特点。在5%标注数据的设置下,RDC在Dice系数、Jaccard系数、95HD和ASD 这4个指标上全面领先,其中Dice系数达到了90.15%,显著优于BCP (87.59%)与PS-MT (86.94%)等方法。这一结果体现了所引入的分布一致性建模在处理小体积、模糊边界结构时的优势。特别是代理机制能够增强模型对区域内语义上下文的响应能力,而排序对齐策略则提升了一致性约束在预测不确定区域的稳定性。与此相对,DiffRect虽然通过潜在扩散过程对伪标签进行了校正,显著提升了伪标签质量,但其主要关注点在于优化伪标签本身,而忽略了医学图像中固有的像素间相关性,导致模型在处理具有复杂相邻关系的结构(如心肌和心腔)时表现逊色。相比之下,RDC方法通过引入像素与代理之间的相似性度量,有效地捕捉了像素间的结构相关性,提升了分割性能。更重要的是,RDC方法在不增加推理复杂度的情况下实现了性能提升,具备良好的实际部署潜力。

    3.2.2   LA数据集实验结果

    LA数据集结构形态复杂,前后壁差异显著,尤其考验模型的空间一致性与长距离依赖建模能力。从表2可以看出,在仅有5%标注数据的条件下,RDC取得了89.96%的Dice系数,超过了PS-MT (88.49%)与SS-Net (86.33%)等先进方法。在Jaccard系数与边界指标(95HD、ASD)方面,RDC同样领先,说明其在三维结构保持方面具备较强的建模能力。值得注意的是,LA数据集中的三维体积数据标注难度较高,伪标签中的噪声比例通常较大。传统方法如UA-MT和DTC,在这种噪声较大的数据上容易产生过拟合,导致性能下降。而RDC通过引入排序对齐的松弛机制,有效减少了伪标签中的噪声对监督信号的影响,增强了训练过程中的鲁棒性。与具有竞争力的ABD和CauSSL方法相比,这两种方法虽然通过增强局部区域或建模因果关系来提升模型鲁棒性,但本质上仍然依赖个体像素级一致性监督。ABD通过自适应位移增强局部区域对噪声的鲁棒性,但没有充分考虑像素间的语义相关性,因此在处理复杂结构(心脏或左心房等紧密区域)时导致语义受限。类似地,CauSSL通过因果关系建模提升了伪标签的可靠性,但同样忽略了像素间的相对结构关系。相比之下,RDC通过引入像素–代理相关性分布建模,能够更有效地建模像素间的高阶结构信息,从而在复杂任务中获得更好的性能。

    3.2.3   Pancreas-NIH数据集实验结果

    Pancreas-NIH为增强腹部CT数据集,具有器官形态变异大、与周围组织对比度低等挑战性特征,代表了更难的分割任务。在10%与20%标注比例下,RDC在所有评估指标上依然保持领先。如表3所示,RDC在20%标注数据条件下的Dice系数为90.85%,而BCP与CauSSL分别为82.91%与80.92%,相差超过7个百分点。同时,RDC在95HD与ASD指标上也取得了最低值,进一步证明本文所提方法在困难场景下依然具有强鲁棒性。这一表现归因于RDC在设计时充分考虑了像素间的语义相关性建模,尤其在复杂的解剖形态与模糊边界区域,能够有效避免伪标签噪声导致的误分类。相比之下,其他方法如MCF与ASE-Net虽然具有一定的鲁棒性设计,但它们没有建模像素间的结构共性,因此在面对复杂形变的结构时,其分割精度和一致性表现较弱,容易受到低对比度和小体积区域的影响,导致性能波动。

    3.2.4   可视化结果分析

    图3所示,本文进一步在ACDC与LA数据集上进行了定性分割结果展示。可以观察到,在心肌边界模糊、心房后壁曲率较大的区域,RDC所生成的分割结果在边缘一致性、区域连贯性等方面均优于对比方法。例如,在LA数据集中,MCF与BCP存在边界破碎、前后壁不闭合的情况,而RDC能够在仅5%标注条件下保持清晰且连贯的结构轮廓。这一现象进一步验证了RDC所引入的代理机制与排序对齐策略在语义建模与边界感知方面的有效性。

    图  3  在ACDC (5%)和LA (5%)数据集上的定性比较
    Fig.  3  Qualitative comparison on ACDC (5%) and Left Atrium (5%) datasets
    下载: 全尺寸图片
    3.2.5   极端稀缺标注场景下的有效性分析

    为了验证在极端标注稀缺场景下的鲁棒性,本文在 ACDC 数据集上增加了仅使用 1% 标注数据(1张有标注+69张无标注)的设置进行评估,如表4所示。可以看出,传统方法在此场景下普遍出现显著性能下降,例如UA-MT和DTC的Dice系数仅分别达到43.01%和49.67%,难以为模型提供稳定的监督信号。尽管PS-MT与BCP在部分指标上有所改善,但仍不足以抵御伪标签中高比例噪声带来的负面影响。DiffRect利用潜在扩散模型对伪标签进行了校正,使得性能相较于传统一致性方法有一定提升,但其优化重点依然在于伪标签质量,而非像素间的相关性建模。相比之下,RDC方法在Dice和Jaccard指标上分别达到了80.38%和73.05%。

    表  4  极端数据稀缺场景下的 ACDC 数据集定量结果
    Table  4  Quantitative results under extreme data-scarce scenario on the ACDC dataset
    方法 1%/1xl+69xu
    Dice↑ Jaccard↑ 95HD↓ ASD↓
    VNet (Sup.Only) 28.74 20.92 47.35 30.56
    UA-MT[36] 43.01 35.78 26.05 13.43
    DTC[44] 49.67 39.89 20.42 11.00
    MC-Net+[10] 54.28 45.66 16.75 9.94
    PS-MT[32] 73.17 63.43 12.30 5.36
    BCP[15] 77.93 70.51 9.03 3.36
    DiffRect[52] 77.28 70.82 9.38 3.20
    RDC 80.38 73.05 7.63 2.84
    注:加黑代表最优性能。

    这一结果表明,RDC所引入的像素–代理相关性建模与排序对齐策略能够在极端稀缺标注下依旧有效地挖掘未标注数据中的潜在信息,并保持模型训练的稳定性,体现出实际应用价值。

    为了更深入地探究所提方法的有效性,本文在ACDC数据集5%标注划分下开展一系列消融实验,并以Dice系数作为主要评估指标,用于分析RDC的有效性。

    3.3.1   各模块有效性分析

    表5给出了本文在ACDC (5%)与LA (5%)数据集上不同模块组合的指标结果,用以验证各组成模块的贡献。需要说明的是,“Contrastive”表示本文在基线方法上复现的SS-Net[47]结果,这是一种经典的对比学习方法;“DC”(distribution-wise consistency)表示分布层面一致性,该方法基于KL散度构建监督信号而未引入“Relaxed”;“Relaxed”表示将DC中严格的分布对齐松弛为排序对齐。换言之,“DC”与“Relaxed”共同构成了本文提出的RDC。为了更加全面地验证RDC方法的有效性,本文在实验中引入了对比学习方法,其本质上也可以看作是通过构造正负样本对来建模像素间的信息关联。的确,如表5第1行与第2行对比所示,对比学习对于像素级一致性正则化基线带来一定性能提升,但仍不如分布层面一致性正则化(第2行对比第3与第4行)。其中的主要原因在于对比学习中正负样本构造较为复杂,且不够可靠。第1行与第3行对比表明,即使是最基础的分布层面一致性引入,也能在像素级一致性正则化的基线上获得显著性能提升,这说明了像素间丰富的相关性可以为一致性正则提供更多信息增益。第3行与第4行对比进一步说明,将直接像素代理相关性值的严格对齐放松为排序对齐,也显著提升了分割性能。本文认为,其主要原因在于RDC具备内在的抗噪能力,从而更有效地挖掘像素间相关性潜力。

    表  5  不同模块的消融实验
    Table  5  Ablation studies of different components
    Contrastive DC Relaxed ACDC (5%) LA (5%)
    87.21 88.16
    88.25 88.76
    88.98 89.27
    90.15 89.96
    注:加黑代表最优性能。
    3.3.2   正交代理选择策略有效性分析

    表6给出了本文在代理选择策略上的比较实验,涵盖“ALL”(将所有像素作为代理)、“Random”(在像素嵌入中随机选择N个代理)、“Top-N”(根据像素维度的累计自相关矩阵选择前N个像素作为代理)以及本文提出的“Orthogonal”策略。将所有像素作为代理并不是理想的策略,因为这会不可避免地引入大量噪声,从而降低监督信号的质量,导致模型性能下降。本文提出的“Orthogonal”策略取得了最佳效果,这与本文的设计初衷一致,即选出的代表性代理能够与后续的相关性层面一致性配合良好。图4给出了通过“Orthogonal”选择的代理在图像上的激活响应图。可以观察到,不同的代理激活图像的不同区域,能较好地捕捉原始像素中的多样语义信息。这些代理保留了图像中尽可能多的关键信息,从而为后续一致性构建提供了坚实基础。

    表  6  代理选择的消融实验
    Table  6  Ablation of different agent selection strategies %
    代理选择 Dice
    ALL 88.32
    Random 88.85
    Top-N 89.06
    Orthogonal 90.15
    注:加黑代表最优性能。
    图  4  基于正交选择的代理激活图可视化
    Fig.  4  Visualization of the agent activation maps from orthogonal selection
    下载: 全尺寸图片
    3.3.3   分布级一致性策略分析

    为了探究在分布层面一致性(DC)上构建监督信号的不同策略的有效性,本文进行了表7中的实验比较。本文考察了L2损失、交叉熵损失(cross entropy,CE)、KL散度、Huber损失和抗噪KL散度等常用鲁棒损失函数。这些方法均以严格数值对齐的方式对相关性值进行约束。然而,传统的严格数值对齐方法可能受到噪声的干扰,因为这些方法完全依赖于数据驱动的无监督优化,其数值本身的可靠性相对较低,易受到异常值的影响。尽管Huber损失通过对误差进行平滑处理增强了鲁棒性,但其本质上仍然依赖于对数值误差的最小化。类似地,抗噪KL散度在优化时虽然能够减少伪标签噪声的影响,但仍基于精确的分布对齐,这在噪声数据中可能导致不稳定的监督信号,特别是在数据极端稀缺或伪标签质量差的情况下。因此,本文提出松弛排序对齐策略Relaxed,将对齐目标从数值精确对齐松弛为排序对齐,其基本出发点在于,尽管相关性分布中的具体数值可能受到噪声扰动而产生偏差,但其相对排序通常具有更强的稳定性,从而取得了明显优于其他策略的性能表现。

    表  7  分布一致性的消融实验
    Table  7  Ablation of distribution consistency %
    分布一致性 Dice
    L2 88.68
    CE 88.79
    KL 88.98
    Huber损失 89.03
    抗噪KL散度 89.24
    Relaxed 90.15
    注:加黑代表最优性能。
    3.3.4   代理数量$ N $的评估

    为了探讨代理数量$ N $对模型性能的影响,本文在ACDC(5%标注)、LA(5%标注)和Pancreas-NIH(10%标注)3个数据集上进行了对比实验,如表8所示。模型在ACDC和LA数据集上代理数量$ N=64 $时表现最佳,而在Pancreas-NIH数据集上,代理数量$ N=\text{128} $达到最佳表现。具体而言,在ACDC和LA数据集上,较少的代理数量(如$ N=\text{32} $)导致信息不足,难以全面捕捉心脏区域的多样化语义特征,而过多的代理数量则可能引入噪声,降低性能。而在Pancreas-NIH数据集上,较大的代理数量$ N=\text{128} $能够更好地覆盖小器官(如胰腺)与周围组织的复杂结构,提升模型的鲁棒性。因此,针对不同的器官和数据集,选择适当的代理数量对分割效果具有重要影响。

    表  8  代理数量N的评估
    Table  8  Evaluation of the agents number N
    N Dice/%
    ACDC LA Pancreas-NIH
    32 89.18 88.79 80.03
    64 90.15 89.96 80.87
    128 89.56 89.32 81.01
    256 89.27 88.90 80.25
    注:加黑代表最优性能。

    综合来看,尽管Pancreas-NIH数据集在$ N=\text{128} $时表现最佳,但为了在方法普适性与最佳性能之间取得平衡,并避免针对特定任务进行过度调参,本文默认使用$ N=\text{64} $,因为它在3个数据集上均表现出了较好的性能平衡,这得益于正交选择策略,能够构建一个信息丰富且不冗余的代理集,同时排序对齐策略对超参选择提供了较强的鲁棒性,从而确保了在多个数据集上的稳健表现。

    3.3.5   超参分析

    参数$ \lambda $用于控制排序感知的相关性一致性损失项的权重。表9中的实验表明,当$ \lambda =0.1 $时,模型性能最佳,排序对齐策略可以有效提升模型性能。进一步分析发现,较小的$ \lambda $(如0.05)未能充分发挥排序对齐策略的优势,导致性能下降;而较大的$ \lambda $(如0.5)则过度强调排序一致性,可能抑制了伪标签中的有效信息,从而影响了最终的分割精度。因此,$ \lambda =0.1 $是在保持噪声鲁棒性的同时,平衡了模型对像素级和分布级损失的优化,取得了最优的性能表现。

    表  9  权重λ的评估
    Table  9  Evaluation of thetrade-off weight λ
    λ Dice/%
    0.05 89.36
    0.1 90.15
    0.2 89.83
    0.5 89.26
    注:加黑代表最优性能。

    本文针对现有半监督医学图像分割方法中像素级一致性监督的性能瓶颈,提出了一种融合像素间相关性的松弛分布一致性方法RDC。该方法在教师–学生框架下,引入一组代表性代理特征,以建模图像中丰富的像素间结构关联,并通过分布级一致性约束对齐像素与代理之间的相关性分布,从而提升了伪标签的一致性与表达能力。进一步地,本文设计了排序对齐策略,将严格的数值一致性放松为相对排序一致性,从而增强模型对噪声的鲁棒性。在ACDC、LA和Pancreas-NIH 共3个具有挑战性的公共医学图像分割数据集上,本文所提RDC方法在多个评估指标上均显著优于现有先进方法,验证了其有效性与通用性。然而,RDC方法也存在一定的局限性。首先,RDC方法对代理特征的选择依赖于正交选择策略,而如何选择合适的代理数量仍需要根据具体数据集进行调整,这可能导致模型在某些特定场景上的适应性问题;其次,尽管排序对齐策略有效增强了噪声鲁棒性,但在某些极端缺乏标注数据的场景下,排序一致性可能不足以完全弥补伪标签的不可靠性,这可能导致分割精度的波动。未来的工作将致力于进一步优化RDC方法的自适应能力,探索如何在不同的数据分布下自动调节代理选择数量。此外,也将结合主动学习、增量学习等策略,以进一步降低对标注数据的依赖,推动RDC在低资源环境下的实际应用和落地。

  • 图  1   本文方法的动机示意

    Fig.  1   Illustration of our motivation

    下载: 全尺寸图片

    图  2   松弛分布一致性的半监督医学图像分割方法流程

    Fig.  2   Flowchart of the relaxed distribution-wise consistency for semi-supervised medical image segmentation

    下载: 全尺寸图片

    图  3   在ACDC (5%)和LA (5%)数据集上的定性比较

    Fig.  3   Qualitative comparison on ACDC (5%) and Left Atrium (5%) datasets

    下载: 全尺寸图片

    图  4   基于正交选择的代理激活图可视化

    Fig.  4   Visualization of the agent activation maps from orthogonal selection

    下载: 全尺寸图片

    表  1   不同半监督医学图像分割方法在ACDC数据集上的定量结果

    Table  1   Quantitative results of different semi-supervised medical image segmentation methods on the ACDC dataset

    方法 5%/3xl+67xu 10%/7xl+63xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    U-Net (只用标注) 47.83 37.01 31.16 12.62 79.41 68.11 9.35 2.70
    UA-MT[36] 46.04 35.97 20.08 7.75 81.65 70.64 6.88 2.02
    DTC[44] 56.90 45.67 23.36 7.39 84.29 73.92 12.81 4.01
    URPC[45] 55.87 44.64 13.60 3.74 83.10 72.41 4.84 1.53
    SS-Net[47] 65.82 55.38 6.67 2.28 86.78 77.67 6.07 1.40
    MC-Net+[10] 62.85 52.29 7.62 2.33 87.10 76.06 6.68 2.00
    PS-MT[32] 86.94 77.90 4.95 2.18 88.91 80.79 4.96 1.83
    CauSSL[49] 89.66 81.79 3.67 0.93
    ABD[9] 88.96 80.70 1.57 0.52 89.81 81.95 1.46 0.49
    M-CnT[50] 88.40 4.40
    BCP[15] 87.59 78.67 1.90 0.67 88.84 80.62 3.98 1.17
    Diff-CL[51] 88.75 79.21 1.56 0.51 89.21 80.98 3.04 1.02
    DiffRect[52] 85.61 77.22 2.84 1.10 87.65 80.89 2.31 0.52
    RDC 90.15 81.87 1.38 0.45 90.78 82.36 1.34 0.41
    注:加黑代表最优性能。

    表  2   不同半监督医学图像分割方法在左心房(LA)数据集上的定量结果

    Table  2   Quantitative results of different semi-supervised medical image segmentation methods on the Left Atrium dataset

    方法 5%/4xl+76xu 10%/8xl+72xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    VNet (只用标注) 52.55 39.60 47.05 9.87 82.74 71.72 13.35 3.26
    UA-MT[36] 82.26 70.98 13.71 3.82 86.28 76.11 18.71 4.63
    DTC[44] 81.25 69.33 14.90 3.99 87.51 78.17 8.23 2.36
    URPC[45] 82.48 71.35 14.65 3.65 85.01 74.36 15.37 3.96
    SS-Net[47] 86.33 76.15 9.97 2.31 88.55 79.62 7.49 1.90
    MC-Net+[10] 83.59 72.36 14.07 2.70 88.96 80.25 7.93 1.86
    PS-MT[32] 88.49 79.13 8.12 2.78 89.72 81.48 6.94 1.92
    BCP[15] 88.02 78.72 7.90 2.15 89.62 81.31 6.81 1.76
    Diff-CL[51] 87.93 79.16 7.04 2.01 90.02 82.78 5.93 1.84
    DiffRect[52] 88.52 79.71 6.96 1.78 89.98 81.74 6.49 1.95
    RDC 89.96 82.07 6.23 1.67 90.85 83.16 5.47 1.58
    注:加黑代表最优性能。

    表  3   不同半监督医学图像分割方法在Pancreas-NIH数据集上的定量结果

    Table  3   Quantitative results of different semi-supervised medical image segmentation methods on the Pancreas-NIH dataset

    方法 10%/6xl+56xu 20%/12xl+50xu
    Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm Dice↑/% Jaccard↑/% 95HD↓/mm ASD↓/mm
    VNet (只用标注)) 55.60 41.74 45.33 18.63 72.38 58.26 19.35 5.89
    UA-MT[36] 66.34 53.21 17.21 4.57 76.10 62.62 10.84 2.43
    DTC[44] 69.21 54.06 17.21 5.95 78.27 64.75 8.36 2.25
    ASE-Net[46] 71.54 56.82 13.33 5.73 79.03 66.57 8.62 2.30
    SS-Net[47] 71.76 57.05 17.56 5.77 79.78 66.32 8.86 2.01
    MC-Net+[10] 70.00 55.66 16.03 3.87 79.37 66.83 8.52 1.72
    PS-MT[32] 76.94 62.37 13.12 3.66 80.74 68.15 7.41 2.06
    BCP[15] 73.83 59.24 12.71 3.72 82.91 70.97 6.43 2.25
    CauSSL[49] 72.89 58.06 14.19 1.66 80.92 68.26 8.11 1.53
    Diff-CL[51] 76.12 62.68 12.01 3.39 82.13 69.47 7.50 2.98
    DiffRect[52] 75.23 62.03 12.39 3.20 82.09 68.99 7.78 3.14
    RDC 80.87 68.13 6.59 1.45 83.26 71.47 4.52 1.35
    注:加黑代表最优性能。

    表  4   极端数据稀缺场景下的 ACDC 数据集定量结果

    Table  4   Quantitative results under extreme data-scarce scenario on the ACDC dataset

    方法 1%/1xl+69xu
    Dice↑ Jaccard↑ 95HD↓ ASD↓
    VNet (Sup.Only) 28.74 20.92 47.35 30.56
    UA-MT[36] 43.01 35.78 26.05 13.43
    DTC[44] 49.67 39.89 20.42 11.00
    MC-Net+[10] 54.28 45.66 16.75 9.94
    PS-MT[32] 73.17 63.43 12.30 5.36
    BCP[15] 77.93 70.51 9.03 3.36
    DiffRect[52] 77.28 70.82 9.38 3.20
    RDC 80.38 73.05 7.63 2.84
    注:加黑代表最优性能。

    表  5   不同模块的消融实验

    Table  5   Ablation studies of different components

    Contrastive DC Relaxed ACDC (5%) LA (5%)
    87.21 88.16
    88.25 88.76
    88.98 89.27
    90.15 89.96
    注:加黑代表最优性能。

    表  6   代理选择的消融实验

    Table  6   Ablation of different agent selection strategies %

    代理选择 Dice
    ALL 88.32
    Random 88.85
    Top-N 89.06
    Orthogonal 90.15
    注:加黑代表最优性能。

    表  7   分布一致性的消融实验

    Table  7   Ablation of distribution consistency %

    分布一致性 Dice
    L2 88.68
    CE 88.79
    KL 88.98
    Huber损失 89.03
    抗噪KL散度 89.24
    Relaxed 90.15
    注:加黑代表最优性能。

    表  8   代理数量N的评估

    Table  8   Evaluation of the agents number N

    N Dice/%
    ACDC LA Pancreas-NIH
    32 89.18 88.79 80.03
    64 90.15 89.96 80.87
    128 89.56 89.32 81.01
    256 89.27 88.90 80.25
    注:加黑代表最优性能。

    表  9   权重λ的评估

    Table  9   Evaluation of thetrade-off weight λ

    λ Dice/%
    0.05 89.36
    0.1 90.15
    0.2 89.83
    0.5 89.26
    注:加黑代表最优性能。
  • [1] HAIDEGGER T. Autonomy for surgical robots: concepts and paradigms[J]. IEEE transactions on medical robotics and bionics, 2019, 1(2): 65−76. doi: 10.1109/TMRB.2019.2913282
    [2] BIRLO M, ESWARDS P J E, CLARKSON M, et al. Utility of optical see-through head mounted displays in augmented reality-assisted surgery: a systematic review[J]. Medical image analysis, 2022, 77: 102361. doi: 10.1016/j.media.2022.102361
    [3] 方超伟, 李雪, 李钟毓, 等. 基于双模型交互学习的半监督医学图像分割[J]. 自动化学报, 2023, 49(4): 805−819. doi: 10.16383/j.aas.c210667

    FANG ChaoWei, LI Xue, Li ZhongYu, et al. Interactive dual-model learning for semi-supervised medical image segmentation[J]. Acta automatica sinica, 2023, 49(4): 805−819. doi: 10.16383/j.aas.c210667
    [4] 石军, 王天同, 朱子琦, 等. 基于深度学习的医学图像分割方法综述[J]. 中国图象图形学报, 2025, 30(6): 2161−2186. doi: 10.11834/jig.240467

    SHI Jun, WANG Tiantong, ZHU Ziqi, et al. Deep learning-based medical image segmentation methods[J]. Journal of image and graphics, 2025, 30(6): 2161−2186. doi: 10.11834/jig.240467
    [5] MAI Huayu, SUN Rui, WU Feng. Relaxed class-consensus consistency for semi-supervised semantic segmentation[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Philadelphia: AAAI, 2025.
    [6] SUN Rui, MAI Huayu, LI Wangkai, et al. Towards unbiased learning in semi-supervised semantic segmentation[C]//The Thirteenth International Conference on Learning Representations. Singapore: PMLR, 2025.
    [7] CHEN Xiaokang, YUAN Yuhui, ZENG Gang, et al. Semi-supervised semantic segmentation with cross pseudo supervision[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Virtual: IEEE, 2021.
    [8] 姜婷, 袭肖明, 岳厚光. 基于分布先验的半监督FCM的肺结节分类[J]. 智能系统学报, 2017, 12(5): 729−734. doi: 10.11992/tis.201706018

    JIANG Ting, XI Xiaoming, YUE Houguang. Classification of pulmonary nodules by semi-supervised FCM based on prior distribution[J]. CAAI transactions on intelligent systems, 2017, 12(5): 729−734. doi: 10.11992/tis.201706018
    [9] CHI Hanyang, PANG Jian, ZHANG Bingfeng, et al. Adaptive bidirectional displacement for semi-supervised medical image segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2024.
    [10] WU Yicheng, XU Minfeng, GE Zongyuan, et al. Semi-supervised left atrium segmentation with mutual consistency training[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Strasbourg: MICCAI Society, 2021.
    [11] 邱成健, 刘青山, 宋余庆, 等. 基于循环显著性校准网络的胰腺分割方法[J]. 自动化学报, 2022, 48(11): 2703−2717. doi: 10.16383/j.aas.c210865

    QIU Chengjian, LIU Qingshan, SONG Yuqing, et al. Pancreas segmentation based on recurrent saliency calibration network[J]. Acta automatica sinica, 2022, 48(11): 2703−2717. doi: 10.16383/j.aas.c210865
    [12] MAI Huayu, SUN Rui, ZHANG Tianzhu et al. Rankmatch: exploring the better consistency regularization for semi-supervised semantic segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2024.
    [13] KE Zhanghan, QIU Di, LI Kaican, et al. Guided collaborative training for pixel-wise semi-supervised learning[C]//European Conference on Computer Vision. Glasgow: ECVA, 2020.
    [14] CAO Hu, WANG Yueyue, CHEN Joy, et al. Swin-UNet: UNet-like pure transformer for medical image segmentation[C]//European Conference on Computer Vision Workshops. Tel Aviv: ECVA, 2022.
    [15] BAI Yunchao, CHEN Duowen, LI Qingli, et al. Bidirectional copy-paste for semi-supervised medical image segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: IEEE, 2023.
    [16] GRÜNWALD P D. The minimum description length principle[M]. Massachusetts: MIT Press, 2007.
    [17] GUO Chuan, PLEISS G, SUN Yu, et al. On calibration of modern neural networks[C]//International Conference on Machine Learning. Sydney: PMLR, 2017.
    [18] SUN Rui, LI Yihao, ZHANG Tianzhu, et al. Lesion-aware transformers for diabetic retinopathy grading[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Virtual: IEEE, 2021.
    [19] 赵凤, 张咪咪, 刘汉强. 区域信息驱动的多目标进化半监督模糊聚类图像分割算法[J]. 电子与信息学报, 2019, 41(5): 1106−1113. doi: 10.12000/JRIT180605

    ZHAO Feng, ZHANG Mimi, LIU Hanqiang. Multi-objective evolutionary semi-supervised fuzzy clustering image segmentation motivated by region information[J]. Journal of electronics & information technology, 2019, 41(5): 1106−1113. doi: 10.12000/JRIT180605
    [20] CHEN Xinjian, UDUPA J K, BAGCI U, et al. Medical image segmentation by combining graph cuts and oriented active appearance models[J]. IEEE transactions on image processing, 2012, 21(4): 2035−2046. doi: 10.1109/TIP.2012.2186306
    [21] KHADIDOS A, SANCHEZ V, LI C T. Weighted level set evolution based on local edge features for medical image segmentation[J]. IEEE transactions on image processing, 2017, 26(4): 1979−1991. doi: 10.1109/TIP.2017.2666042
    [22] 刘云, 陆承泽, 李仕杰, 等. 基于高效的多尺度特征提取的轻量级语义分割[J]. 计算机学报, 2022, 45(7): 1517−1528. doi: 10.11897/SP.J.1016.2022.01517

    LIU Yun, LU Chengze, LI Shijie, et al. Effcient multi-scale feature extraction for lightweight semantic segmentation[J]. Chinese journal of computers, 2022, 45(7): 1517−1528. doi: 10.11897/SP.J.1016.2022.01517
    [23] SUN Rui, MAI Huayu, ZHANG Tianzhu, et al. DAW: exploring the better weighting function for semi-supervised semantic segmentation[C]//Proceedings of the Advances in Neural Information Processing Systems. New Orleans: PMLR, 2023.
    [24] MAI Huayu, SUN Rui, ZHANG Tianzhu, et al. Dualrel: semi-supervised mitochondria segmentation from a prototype perspective[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: IEEE, 2023.
    [25] 夏平, 施宇, 雷帮军, 等. 复小波域混合概率图模型的超声医学图像分割[J]. 自动化学报, 2021, 47(1): 185−196. doi: 10.16383/j.aas.c180132

    XIA Ping, SHI Yu, LEI Bangjun, et al. Ultrasound medical image segmentation based on hybrid probabilistic graphical model in complex-wavelet domain[J]. Acta automatica sinica, 2021, 47(1): 185−196. doi: 10.16383/j.aas.c180132
    [26] RONNEBERGER O, FISCHER P, BROX T. U-Net: convolutional networks for biomedical image segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Munich: MICCAI Society, 2015.
    [27] ISENSEE F, JAEGER P F, KOHL S A A, et al. nnU-Net: a self-configuring method for deep learning-based biomedical image segmentation[J]. Nature methods, 2021, 18(2): 203−211. doi: 10.1038/s41592-020-01008-z
    [28] XU Ju, LI Mengzhang, ZHU Zhanxing. Automatic data augmentation for 3D medical image segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Lima: MICCAI Society, 2020.
    [29] ZHOU Zongwei, SIDDIQUEE M M R, TAJBAKHSH N, et al. UNet++: redesigning skip connections to exploit multiscale features in image segmentation[J]. IEEE transactions on medical imaging, 2019, 39(6): 1856−1867. doi: 10.1109/tmi.2019.2959609
    [30] WANG Zhengyang, ZOU Na, SHEN Dinggang, et al. Non-local U-Nets for biomedical image segmentation[C]//Proceedings of the AAAI Conference on Artificial Intelligence. New York: AAAI, 2020.
    [31] ÇIÇEK Ö, ABDULKADIR A, LIENKMP S S, et al. 3D U-Net: learning dense volumetric segmentation from sparse annotation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Athens: MICCAI Society, 2016.
    [32] LIU Yuyan, TIAN Yu, CHEN Yuanhong, et al. Perturbed and strict mean teachers for semi-supervised semantic segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. New Orleans: IEEE, 2022.
    [33] KARIMI D, SALCUDEAN S E. Reducing the hausdorff distance in medical image segmentation with convolutional neural networks[J]. IEEE transactions on medical imaging, 2019, 39(2): 499−513. doi: 10.1109/tmi.2019.2930068
    [34] WONG K C L, MORADI M, TANG H, et al. 3D segmentation with exponential logarithmic loss for highly unbalanced object sizes[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Granada: MICCAI Society, 2018.
    [35] SUN Rui, MAI Huayu, LI Wangkai, et al. Beyond confidence: exploiting homogeneous pattern for semi-supervised semantic segmentation[C]//International Conference on Machine Learning. Vancouver: PMLR, 2025.
    [36] YU Lequan, WANG Shujun, LI Xiaomeng, et al. Uncertainty-aware model for semi-supervised 3D left atrium segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Shenzhen: MICCAI Society, 2019.
    [37] 苏逸欣, 肖志勇. 面向3维心脏MRI分割的半监督双任务交叉一致性约束网络[J]. 中国图象图形学报, 2023, 28(4): 1198−1211. doi: 10.11834/jig.211019

    SU Yixin, XIAO Zhiyong. Semi-supervised dual-task cross-consistency constraint network for 3D cardiac MRI segmentation[J]. Journal of image and graphics, 2023, 28(4): 1198−1211. doi: 10.11834/jig.211019
    [38] XIA Yingda, YANG Dong, YU Zhiding, et al. Uncertainty-aware multi-view co-training for semi-supervised medical image segmentation and domain adaptation[J]. Medical image analysis, 2020, 65: 101766. doi: 10.1016/j.media.2020.101766
    [39] BERNARD O, LALANDE A, ZOTTI C, et al. Deep learning techniques for automatic MRI cardiac multi-structures segmentation and diagnosis: is the problem solved?[J]. IEEE transactions on medical imaging, 2018, 37(11): 2514−2525. doi: 10.1109/TMI.2018.2837502
    [40] XIONG Zhaohan, XIA Qing, HU Zhiqiang, et al. A global benchmark of algorithms for segmenting the left atrium from late gadolinium-enhanced cardiac magnetic resonance imaging[J]. Medical image analysis, 2021, 67: 101832. doi: 10.1016/j.media.2020.101832
    [41] ROTH H R, LU Le, FARAG A, et al. Deeporgan: multi-level deep convolutional networks for automated pancreas segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Munich: MICCAI Society, 2015.
    [42] 李才子, 刘瑞强, 钟焕新, 等. 面向半监督颅内动脉瘤 CTA图像分割的权重感知自洽模型[J]. 计算机科学技术学报, 2023, 38(3): 674−685. doi: 10.1007/s11390-022-0870-1

    LI Caizi, LIU Ruiqiang, ZHONG Huanxin, et al. Semi-supervised intracranial aneurysm segmentation from CTA images via weight-perceptual self-ensembling model[J]. Journal of computer science & technology, 2023, 38(3): 674−685. doi: 10.1007/s11390-022-0870-1
    [43] LI Shuailin, ZHANG Chuyu, HE Xuming. Shape-aware semi-supervised 3D semantic segmentation for medical images[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Lima: MICCAI Society, 2020.
    [44] LUO Xiang, CHEN Jieneng, SONG Tao, et al. Semi-supervised medical image segmentation through dual-task consistency[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Virtual: AAAI, 2021.
    [45] LUO Xiangde, LIAO Wenjun, CHEN Jieneng, et al. Efficient semi-supervised gross target volume of nasopharyngeal carcinoma segmentation via uncertainty rectified pyramid consistency[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Strasbourg: MICCAI Society, 2021.
    [46] 刘少鹏, 洪佳明, 梁杰鹏, 等. 面向医学图像分割的半监督条件生成对抗网络[J]. 软件学报, 2020, 31(8): 2588−2602. doi: 10.13328/j.cnki.jos.005860

    LIU Shaopeng, HONG Jiaming, LIANG Jiepeng, et al. Medical image segmentation using semi-supervised conditional generative adversarial nets[J]. Journal of software, 2020, 31(8): 2588−2602. doi: 10.13328/j.cnki.jos.005860
    [47] WU Yicheng, WU Zhonghua, WU Qianyi, et al. Exploring smoothness and class-separation for semi-supervised medical image segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Singapore: MICCAI Society, 2022.
    [48] WANG Yongchao, XIAO Bin, BI Xiuli, et al. Mcf: Mutual correction framework for semi-supervised medical image segmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: IEEE, 2023.
    [49] MIAO Juzheng, CHEN Cheng, LIU Feng, et al. Caussl: causality-inspired semi-supervised learning for medical image segmentation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. Paris: IEEE, 2023.
    [50] HUANG Huimin, HUANG Yawen, XIE Shiao, et al. Combinatorial CNN-transformer learning with manifold constraints for semi-supervised medical image segmentation[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Vancouver: AAAI, 2024.
    [51] GUO Xiuzhen, YU Lianyuan, SHI Ji, et al. Diff-CL: a novel cross pseudo-supervision method for semi-supervised medical image segmentation[EB/OL]. (2025−03−12)[2025−04−20]. https://arxiv.org/abs/2503.09408.
    [52] LIU Xinyu, LI Wuyang, YUAN Yixuan. Diffrect: latent diffusion label rectification for semi-supervised medical image segmentation[C]//International Conference on Medical Image Computing and Computer Assisted Intervention. Morocco: MICCAI Society, 2024.
WeChat 点击查看大图
图(4)  /  表(9)
出版历程
  • 收稿日期:  2025-07-30
  • 网络出版日期:  2025-12-26

目录

    /

    返回文章
    返回