2. 江南大学物联网工程学院, 江苏无锡 214122
2. Institute of Intelligent Systems and Network Computing, School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China
活动轮廓模型[1]图像分割方法近年来得到了很好的发展,大体可分为基于图像边界信息的分割和基于图像区域信息的分割模型2种。其中基于图像区域信息的Chan-Vese(CV)模型[2],主要是依赖于图像全局的灰度信息,再使用曲线演化理论和水平集方法。模型的求解过程可以转化为寻找能量泛函的极小值问题,通常采用显示欧拉的数值求解方法[3],通过变分法得到能量泛函的Euler-Lagrange方程,最后用有限差分方法进行迭代求解。
CV模型中水平集函数增加了其计算量,存在着耗时长、效率低以及易于陷入局部极小值等问题。 针对模型的改进,李春明等[4]提出的处理强度不均匀图像的局部二元拟合模型;此外,潘改等[5]结合了LBF模型和GAC活动轮廓模型这2种方法,能有效地处理弱边界图像的分割;张开华等[6]提出的局部图像拟合模型,基于高斯滤波的变分水平集方法来处理强度不均匀的图像分割;刘瑞娟等[7]提出的融合局部和全局信息的活动轮廓模型方法;王小峰等[8]提出了一种局部CV活动模型,将局部图像信息融入到模型中。对于数值求解方面的改进,如牛顿方法、与置信域相结合的一般牛顿方法[9]以及在此基础上的改进牛顿方法。此外还有二阶、三阶Runge-Kutta方法[10]在CV模型上的应用。这些算法都能有效地增加了模型的求解速度,并针对不同的问题都有所改进。目前,CV模型被广泛地应用于医学图像分割,并具有很好的发展前景。
本文在优化模型的同时,主要对模型的数值求解过程进行分析改进。首先,分析活动轮廓模型中基于全局信息的CV模型,以及基于局部信息的LBF模型、LIF模型。使用二阶、三阶Runge-Kutta方法,并与Euler方法进行对比实验。主要围绕LBF模型中平滑项系数,时间步长的选取进行讨论。最后通过对非同质图像和同质灰度图像的实验结果分析表明,该模型能够有效地提高数值求解的迭代次数,计算效率高,对不同系数,时间步长的稳定性好。
1 活动轮廓模型 1.1 基于全局区域信息的CV模型经典CV模型[5]是简化Mumford-Shah模型,由学者Chan和Vese提出的一种利用图像区域信息的灰度图像分割方法。在能量泛函中添加了面积项AreainsideC和Mumford-Shah模型中原有的长度项Length(C)一起推动演化曲线到达分割物体的边界。 求解过程中使用变分水平集方法,最小化能量泛函,通过Euler-Lagrange方法进行迭代数值求解。定义能量泛函为
李春明等[4]提出的局部二元拟合模型,有效地解决了C-V模型难以准确分割强度不均匀图像的问题,该模型使用了图像的局部信息,引入一个以高斯函数为核函数的局部二值拟合能量泛函代替C-V模型的全局二值拟合能量项.对于任意像素点x,x∈Ω,其拟合项能量泛函:
当σ的取值过大时,计算量增大;而σ的取值过小时,获取局部区域灰度变化信息的能力降低,一般σ取5。
关于嵌入函数φ(·)的能量泛函最小值得到f1(x)和f2(x):
局部图像拟合(LIF)模型是基于LBF提出的改进区域活动轮廓模型,利用分片光滑函数近似待分割图像。与LBF模型相类似,LIF模型采用了像素点和邻域像素点差值来拟合能量。最后采用高斯滤波器,使得模型对噪声具有较好的鲁棒性和平滑性。其能量泛函的水平集形式可以表示:
综上所述,LBF、LIF模型和C-V模型都是求取全局最小的能量泛函,因此对乘性噪声都具有良好的抗噪性,能分割弱边界或者无边界的图像目标,并且初始曲线可设置在图像任意位置。与C-V模型相比,LBF方法和LIF方法的高斯核函数能获得图像灰度变化的信息,能更准确分割灰度不均匀的图像。LBF方法的能量泛函是以全局误差平方和最小的准则建立起来的,在实际中得到广泛应用。LIF在LBF的基础上,对含有噪声图像的处理结果更加理想。
但是,上述模型在分割灰度值不均匀的复杂图像时,真实的目标和背景的误差平方和往往不是全局最小,而是局部最小。因此,模型的能量泛函不能准确描述复杂图像的目标和背景的特征,容易产生错误分割,或者陷入局部极小值的情况。本文从数值求解优化的角度出发,使用高精度的二阶、三阶Runge-Kutta方法,对CV模型、LBF模型、RIF模型的数值求解进行讨论分析,加快模型的收敛速度,在更少的迭代次数内得到更为精确的数值解。
2 数值求解方法本文使用二阶、三阶Runge-Kutta方法,对活动轮廓模型中有代表性的CV模型、LBF模型、LIF模型的数值求解问题进行讨论分析。
对活动轮廓模型迭代求解时,使用水平集变分法对能量泛函求解,原始CV模型及LBF模型能量泛函均可简化写为
变分法最小化能量泛函E使用Heaviside函数:



对于Euler-Lagrange方程的数值求解,传统的方法是采用Euler方法,本文将采用二阶、三阶Runge-Kutta方法,这2类数值方法的构造思想如下。
2.1 Euler 方法对于给定的初始条件的微分方程y′(t)=f(t,y(t)),y(t)0=y0,Euler方法迭代求解过程为
二阶Runge-Kutta可以表示为

三阶RK格式为
Runge-Kutta方法是求解非线性微分方程的重要数值迭代方法,是Euler方法的一种推广。它提高了计算收敛精度,缩小截断误差,并且具有更好的稳定性。Runge-Kutta方法的导出基于Taylor展开,对所求问题的解具有较好的光滑度,可以使近似公式达到所需要的阶数,并且能够有效提高方法的精度。计算时使用Euler-Lagrange函数在若干点上函数值的线性组合来构造近似公式,因此会在时间复杂度上造成线性的倍数增加[14, 15]。本文采用的显式二阶三阶Runge-Kutta方法并不会在计算复杂度上造成过多的影响。
对模型中的空间导数项的数值离散采用有限差分方法。本文选择二阶精度的中心差分方法进行数值的近似求解,对φi,jn进行半点中心差分,其偏导数为
本文实验是在Matlab R2011b平台上进行的,所用的计算机系统配置如下:CPU为Intel(R) Core(TM) i5-3470; 主频为@3.20GHz; 内存为4GB; 操作系统为Microsoft Windows7 Professional。实验选用的素材参考文献[11],采用的评价方法参考文献[12, 13]。
3.1 LBF模型的参数讨论第1部分的参数讨论分析中,LBF模型对活动轮廓模型Euler-Lagrange函数,即式(14)的长度项光滑项系数nu值,以及时间步长Δt比CV模型,LIF模型更加敏感。因此,本文在式(14)中使用拟合项FLBF,即式(6)。分别对LBF模型中的不同时间步长Δt和不同光滑系数项nu进行3种数值求解方法的实验讨论。
3.1.1 对光滑系数项nu值的讨论首先,本文对LBF模型中的时间步长Δt和光滑系数项nu进行讨论。固定时间步长Δt=0.1,对光滑项系数nu=0.001×255×255到nu=0.005×255×255的结果进行讨论。图 1~3中iter为模型迭代次数。观察图 1~3( 79×75)可知,Euler方法、二阶RK方法、三阶RK方法在nu≤0.001×255×255时,实验分割结果不稳定,会造成图片左侧的误分割现象;而当nu>0.005×255×255时,实验的分割结果会陷入局部极小值,不能对图像完全分割;而当值处于0.001×255×255<nu<0.005×255×255之间的稳定区域间时,可以明显看出,三阶RK方法比二阶RK方法和Euler方法能够在更少的迭代次数内得到图像的准确分割。
![]() |
图 1 显式Euler方法的图像分割结果Fig. 1 Segment results by explicit Euler method |
![]() |
图 2 RK-2方法的图像分割结果Fig. 2 Segment results by RK-2 method |
![]() |
图 3 RK-3方法的图像分割结果Fig. 3 Segment results by RK-3 method |
固定光滑项系数nu=0.003×255×255,对Δt=0.01,0.05,0.1,0.2,0.3的实验结果进行讨论。本文选取比较有代表性的4个时间步长,对不同时间步长下的Euler方法、二阶RK方法、三阶RK方法进行讨论分析。观察图 4~6(size 127×96),当Δt=0.01时,三阶RK方法需要迭代800次才能得到最终的结果,而当Δt=0.05,0.1,0.2时,迭代次数依次递减。而当Δt>0.2,取Δt=0.3时,3种方法都不能得到图像的正确分割结果。综合考虑,本文所使用的RK3方法在稳定区域内,不同的时间步长下,均能在更少的迭代次数内得到正确的分割结果。
![]() |
图 4 显式Euler方法的图像分割结果Fig. 4 Segment results by explicit Euler method |
![]() |
图 5 RK-2方法的图像分割结果Fig. 5 Segment results by RK-2 method |
![]() |
图 6 RK-3方法的图像分割结果Fig. 6 Segment results by RK-3 method |
在第2部分实验中,本文分别讨论使用LIF模型中的局部信息拟合项FLIF和全局信息拟合项FCV时,对强度不均匀的图像和一般灰度图像的3种数值求解方法的进行分析。
3.2.1 局部信息拟合项对强度不均匀图像的分析实验中所选图例均为图像分割实验中的经典图例。在对强度不均匀图像的处理中,本文选择LIF模型中的考虑局部信息的拟合项FLIF,其形式与式(6)中的FLBF拟合项格式相同,在最后采用高斯滤波器,使得模型对噪声具有较好的鲁棒性和平滑性。参数设置时,统一设置时间步长Δt=0.1,光滑项系数nu设置为4幅图像的经验参数中的最优参数:(a)nu=0.003×255×255,(b)nu=0.002×255×255,(c)nu=0.001×255×255,(d)nu=0.001×255×255。
通过观察图 7~9可知,在有限的迭代次数下,二阶RK方法均能更快地得到最终解,其中RK-2方法的收敛速度也明显优于Euler方法;而对比表 1中数据可知,由于二阶、三阶RK方法的计算复杂度上比Euler方法更高,二阶RK及三阶RK方法整体运行时间上略慢于Euler方法。然而其收敛速度,精确度均比Euler方法更好。
![]() |
图 7 显式Euler方法的图像分割结果Fig. 7 Segment results by explicit Euler method |
![]() |
图 8 RK-2方法的图像分割结果Fig. 8 Segment results by RK-2 method |
![]() |
图 9 RK-3方法的图像分割结果Fig. 9 Segment results by RK-3 method |
方法 | 图3(a)119×78 | 图3 (b)111×110 | 图3 (c)103×131 | 图3 (d)128×128 |
Euler | 0.142 | 0.435 | 0.556 | 0.122 |
RK-2 | 0.194 | 0.731 | 1.111 | 0.203 |
RK-3 | 0.312 | 1.100 | 1.613 | 0.310 |
在对一般灰度图像实验分析时,本文使用式(2)的全局信息拟合能量项FCV,对3幅比较有代表性的一般图像进行实验对比分析。统一设置时间步长Δt=1,光滑项系数nu=0.001×255×255。实验结果如图 10~12所示。
![]() |
图 10 显式Euler方法的图像分割结果Fig. 10 Segment results by explicit Euler method |
![]() |
图 11 RK-2方法的图像分割结果Fig. 11 Segment results by RK-2 method |
![]() |
图 12 RK-3方法的图像分割结果Fig. 12 Segment results by RK-3 method |
从图 10(a)、11(a)、11(a)中可以看出,采用Euler方法,本文二阶、三阶RK方法得到的分割结果类似,均能在2次迭代之后收敛。这里主要是因为图像的分辨率较小且图像自身简单。此时,3种方法均能得到正确结果;再观察图 10(b)、11(b)、12(b),二阶RK及三阶RK均能得到正确的分割结果,而Euler方法分割不完全,且带有许多不连续点;对含有大量噪声的图 10(c)、11(c)、12(c),3种模型的抗噪能力均比较差,在迭代20次时,模型分割都带有大量噪点。也表明了本文方法没有在鲁棒性上着重改进。观察表 2可知,当使用全局能量拟合项时,本文二阶、三阶RK模型,与Euler方法运行时间相近,且能得到更准确的分割结果。综上所述,本文方法具有一定的优势。
方法 | 图4(e)84×84 | 图4 (f)128×128 | 图4(g)256×256 |
Euler | 0.030 | 0.048 | 0.302 |
RK-2 | 0.034 | 0.039 | 0.444 |
RK-3 | 0.038 | 0.041 | 0.602 |
本文使用高阶数值求解优化方法解决水平集变分图像分割问题。通过将二阶、三阶Runge-Kutta方法,与传统Euler方法在基于全局区域信息的CV模型,及基于局部区域信息的LBF、 LIF模型上实验对比分析可知:本文模型对光滑项系数及不同时间步长的情况下,均能更快地得到实验结果,并有效提高了分割的精度。实验结果表明,RK-2、RK-3方法的使用提高了计算精度、减少迭代次数、减小迭代误差,且比Euler方法具有更好地稳定性。然而RK-2、RK-3方法在在计算复杂度上比传统Euler方法较为复杂。因此,从模型和数值求解优化问题相结合的角度出发,如何选择更优的数值求解方法,以得到更优的实验结果,将作为今后继续研究发展的一个方向。
[1] | VESE L A, CHAN T F. A multiphase level set framework for image segmentation using the Mumford and Shah model[J]. International Journal of Computer Vision, 2002, 50(3):271-293. |
[2] | CHAN T F, VESE L A. Active contours without edges[J]. IEEE Transactions on Image Processing, 2001, 10(2):266-277. |
[3] | COHEN L D, COHEN I. Finite-element methods for active contour models and balloons for 2-D and 3-D images[J]. IEEE Transactionson on Pattern Analysis Machine Intelligence, 1993, 15(11):1131-1147. |
[4] | LI Chunming, KAO C Y, GORE J C, et al. Implicit active contours driven by local binary fitting energy[J]. IEEE Conference on Computer Vision and Pattern Recognition, 2007:1-7. |
[5] | 潘改, 高立群, 张萍. 基于LBF方法的测地线活动轮廓模型[J]. 模式识别与人工智能, 2013, 26(12):1179-1184. PAN Gai, GAO Liqun, ZHANG Ping. Geodesic active contour based on LBF method[J]. Pattern Recognition and Aitificial Intelligence, 2013, 26(12):1179-1184. |
[6] | ZHANG Kaihua, SONG Huihui, ZHANG Lei. Active contours driven by local image fitting energy[J]. Pattern Recognition, 2010, 43(4):1199-1206. |
[7] | 刘瑞娟, 何传江, 原野. 融合局部和全局图像信息的活动轮廓模型[J]. 计算机辅助设计与图形学报, 2012, 24(3):364-371. LIU Ruijuan, HE Chuanjiang, YUAN Ye. Active contours driven by local and global image fitting energy[J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(3):364-371. |
[8] | WANG Xiaofeng, HUANG Deshuang, XU Huan. An efficient local Chan-Vese model for image segmentation[J]. Pattern Recognition, 2010, 43(3):603-618. |
[9] | BAR L, SAPIRO G. Generalized Newton-type methods for energy formulations in image processing[J]. SIAM Journal on Imaging Sciences, 2009, 2(2):508-531. |
[10] | SCHEUERMANN B, ROSENHAHN B. Analysis of numerical methods for level set based image segmentation[J]. Advances in Visual Computing, 2009, 5876:196-207. |
[11] | LI Chunming, KAO C Y, GORE J C, et al. Minimization of region-scalable fitting energy for image segmentation[J]. IEEE Transcations on Image Processing, 2008, 17(10):1940-1949. |
[12] | GE Feng, WANG Song, LIU Tiecheng. New benchmark for image segmentation evaluation[J]. Journal of Electronic Imaging, 2007, 16(3):1010-1016. |
[13] | 任守纲, 马超, 徐焕良. 基于改进主动轮廓模型的图像分割方法研究[J]. 计算机科学, 2013, 40(7):289-292, 296. REN Shougang, MA Chao, XU Huanliang. Improved skeleton extracton algorithm based active contour model research[J]. Computer Science, 2013, 40(7):289-292, 296. |
[14] | CORMEN T H, LEISER C E, RIVEST R L, et al. Introduction to Algorithms[M]. 3rd ed. Cambridge, Mass:MIT press, 2009:350-400. |
[15] | JOHNSON M L. Essential numerical computer methods[M]. Burlington, MA:Academic Press, 2010:230-275. |