数值求解优化问题在活动轮廓模型上的应用

Download PDF 打印本文

文章快速检索

高级检索

引用本文

廖翠萃, 李敏, 梁久祯, 廖祖华. 数值求解优化问题在活动轮廓模型上的应用[J]. 智能系统学报, 2015, 10(6): 886-892 复制到剪切板

LIAO Cuicui, LI Min, LIANG Jiuzhen, LIAO Zuhua. Application of a numerical solution to the optimization problem in the active contour model[J]. CAAI Transactions on Intelligent Systems, 2015, 10(6): 886-892.

DOI: 10.11992/tis.201507037 复制到剪切板

数值求解优化问题在活动轮廓模型上的应用

廖翠萃¹, 李敏², 梁久祯², 廖祖华¹

1. 江南大学理学院, 江苏无锡 214122;
2. 江南大学物联网工程学院, 江苏无锡 214122

基金项目: 国家自然科学基金资助项目(11401259);中央高校基本科研业务费专项资金资助项目(jusrr11407).

作者简介: 李敏,女, 1990年生,硕士。发表CSCD论文一篇,主持江苏省研究生科研实践项目一项。主要研究方向数字图像处理。
梁久祯,男, 1968生,教授,博士。主要研究方向为机器视觉、图像处理等。在专业杂志与国内外会议等发表学术论文120余篇,其中被SCI检索8篇、EI检索33篇、CSCD检索60篇。主持国家自然科学基金项目1项、省部级项目3项。

收稿日期: 2015-04-30; 网络出版日期: 2015-11-10

通信作者: 廖翠萃,女, 1983年生,博士,讲师。发表SCI检索论文4篇、CSCD论文4篇,主持国家自然科学基金项目1项。主要研究方向为保结构数值计算方法。E-mail:cliao@jiangnan.edu.cn.

摘要: 针对活动轮廓模型图像分割过程中迭代次数多,分割速度慢的问题,提出一种高阶的数值求解方法。分析活动轮廓模型中基于全局信息的CV模型,以及基于局部信息的LBF模型,LIF模型。使用二阶、三阶Runge-Kutta方法,原始Euler方法对模型进行数值求解实验对比分析。并对LBF模型中平滑项系数,时间步长的选取进行讨论。通过对非同质图像、同质图像的实验结果分析表明,所采用的数值方法能够有效地提高数值收敛精度、减少迭代次数、计算效率高。对不同系数和时间步长,数值方法也能表现出较好的稳定性。

关键词: CV模型 LBF模型 Runge-Kutta方法数值求解优化图像分割

Application of a numerical solution to the optimization problem in the active contour model

LIAO Cuicui¹ , LI Min², LIANG Jiuzhen², LIAO Zuhua¹

1. Department of Information and Computaion Science, College of Science, Jiangnan University, Wuxi 214122, China;
2. Institute of Intelligent Systems and Network Computing, School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China

Abstract: In this paper, we analyze numerical optimization procedures and propose high-order numerical methods to deal with the problems of slow convergence and low efficiency in the active contour model. First, we analyze the global information region-based active contour Chan-Vese(CV) model, the local information region-based local binary fitting(LBF) model, and the local image fitting(LIF) model. Then, we compare and analyze image segment results utilizing second-and third-order explicit Runge-Kutta methods, and the standard explicit Euler method. We also analyze the segment results of different sliding coefficient parameters and time steps of the LBF model. The experimental results for the intensity inhomogeneities and common images show that the proposed numerical methods can reduce the number of iterations, and improve convergence accuracy and computational efficiency. In addition, for different coefficients and time steps, the proposed methods yield greater stability.

Key words: CV model LBF model Runge-Kutta method numerical optimization procedure image segment

活动轮廓模型^[1]图像分割方法近年来得到了很好的发展，大体可分为基于图像边界信息的分割和基于图像区域信息的分割模型2种。其中基于图像区域信息的Chan-Vese(CV)模型^[2]，主要是依赖于图像全局的灰度信息，再使用曲线演化理论和水平集方法。模型的求解过程可以转化为寻找能量泛函的极小值问题，通常采用显示欧拉的数值求解方法^[3]，通过变分法得到能量泛函的Euler-Lagrange方程，最后用有限差分方法进行迭代求解。

CV模型中水平集函数增加了其计算量，存在着耗时长、效率低以及易于陷入局部极小值等问题。针对模型的改进，李春明等^[4]提出的处理强度不均匀图像的局部二元拟合模型；此外，潘改等^[5]结合了LBF模型和GAC活动轮廓模型这2种方法，能有效地处理弱边界图像的分割；张开华等^[6]提出的局部图像拟合模型，基于高斯滤波的变分水平集方法来处理强度不均匀的图像分割；刘瑞娟等^[7]提出的融合局部和全局信息的活动轮廓模型方法；王小峰等^[8]提出了一种局部CV活动模型，将局部图像信息融入到模型中。对于数值求解方面的改进，如牛顿方法、与置信域相结合的一般牛顿方法^[9]以及在此基础上的改进牛顿方法。此外还有二阶、三阶Runge-Kutta方法^[10]在CV模型上的应用。这些算法都能有效地增加了模型的求解速度，并针对不同的问题都有所改进。目前，CV模型被广泛地应用于医学图像分割，并具有很好的发展前景。

本文在优化模型的同时，主要对模型的数值求解过程进行分析改进。首先，分析活动轮廓模型中基于全局信息的CV模型，以及基于局部信息的LBF模型、LIF模型。使用二阶、三阶Runge-Kutta方法，并与Euler方法进行对比实验。主要围绕LBF模型中平滑项系数，时间步长的选取进行讨论。最后通过对非同质图像和同质灰度图像的实验结果分析表明，该模型能够有效地提高数值求解的迭代次数，计算效率高，对不同系数，时间步长的稳定性好。

1 活动轮廓模型 1.1 基于全局区域信息的CV模型

经典CV模型^[5]是简化Mumford-Shah模型，由学者Chan和Vese提出的一种利用图像区域信息的灰度图像分割方法。在能量泛函中添加了面积项AreainsideC和Mumford-Shah模型中原有的长度项Length(C)一起推动演化曲线到达分割物体的边界。求解过程中使用变分水平集方法，最小化能量泛函，通过Euler-Lagrange方法进行迭代数值求解。定义能量泛函为

式中：μ,γ≥0为权重系数，I₀(x,y)为待分割图像，Length(C)表示边界曲线C的长度项，AreainsideC为曲线C的内部区域的面积项，F^cv为活动轮廓线运动的基于全局信息的拟合项：

式中：c₁、c₂为活动轮廓线内部和外部的强度均值：

式中：H(·)为Hessian函数。最终的分割轮廓线C的位置及未知常量c₁、c₂通过最优化能量泛函得到：

1.2 基于局部区域信息的LBF模型及LIF模型

李春明等^[4]提出的局部二元拟合模型，有效地解决了C-V模型难以准确分割强度不均匀图像的问题，该模型使用了图像的局部信息，引入一个以高斯函数为核函数的局部二值拟合能量泛函代替C-V模型的全局二值拟合能量项．对于任意像素点x，x∈Ω，其拟合项能量泛函：

式中：轮廓曲线将图像分为区域内和区域外。f₁(x)和f₂(x)分别为像素点x在区域内和区域外的灰度拟合值，具体由像素点x邻域内各个像素点所确定。K_σ(x-y)是标准差为σ的高斯核函数，通常取式(7)表达式：

当σ的取值过大时，计算量增大；而σ的取值过小时，获取局部区域灰度变化信息的能力降低，一般σ取5。

关于嵌入函数φ(·)的能量泛函最小值得到f₁(x)和f₂(x)：

局部图像拟合(LIF)模型是基于LBF提出的改进区域活动轮廓模型，利用分片光滑函数近似待分割图像。与LBF模型相类似，LIF模型采用了像素点和邻域像素点差值来拟合能量。最后采用高斯滤波器，使得模型对噪声具有较好的鲁棒性和平滑性。其能量泛函的水平集形式可以表示：

综上所述，LBF、LIF模型和C-V模型都是求取全局最小的能量泛函，因此对乘性噪声都具有良好的抗噪性，能分割弱边界或者无边界的图像目标，并且初始曲线可设置在图像任意位置。与C-V模型相比，LBF方法和LIF方法的高斯核函数能获得图像灰度变化的信息，能更准确分割灰度不均匀的图像。LBF方法的能量泛函是以全局误差平方和最小的准则建立起来的，在实际中得到广泛应用。LIF在LBF的基础上，对含有噪声图像的处理结果更加理想。

但是，上述模型在分割灰度值不均匀的复杂图像时，真实的目标和背景的误差平方和往往不是全局最小，而是局部最小。因此，模型的能量泛函不能准确描述复杂图像的目标和背景的特征，容易产生错误分割，或者陷入局部极小值的情况。本文从数值求解优化的角度出发，使用高精度的二阶、三阶Runge-Kutta方法，对CV模型、LBF模型、RIF模型的数值求解进行讨论分析，加快模型的收敛速度，在更少的迭代次数内得到更为精确的数值解。

2 数值求解方法

本文使用二阶、三阶Runge-Kutta方法，对活动轮廓模型中有代表性的CV模型、LBF模型、LIF模型的数值求解问题进行讨论分析。

对活动轮廓模型迭代求解时，使用水平集变分法对能量泛函求解，原始CV模型及LBF模型能量泛函均可简化写为

水平集函数初始化定义为

变分法最小化能量泛函E使用Heaviside函数：

及一维的Dirac函数

，使用变分水平集方法对能量泛函极小化，可得Euler-Lagrange方程：

计算时，采用正则化函数H_ε(z)=

，及

，ε→0代替H(z)和δ(z)。

对于Euler-Lagrange方程的数值求解，传统的方法是采用Euler方法，本文将采用二阶、三阶Runge-Kutta方法,这2类数值方法的构造思想如下。

2.1 Euler 方法

对于给定的初始条件的微分方程y′(t)=f(t,y(t)),y(t)₀=y₀，Euler方法迭代求解过程为

式中：f(tⁿ,yⁿ)为Euler-Lagrange方程。对活动轮廓模型数值求解时，Euler方法的格式为

式中：iter为迭代次数。Euler方法形式简单、计算速度快、易于求解，但其在数值精度和数值稳定性方面表现较弱。

2.2 Runge-Kutta 方法

二阶Runge-Kutta可以表示为

对活动轮廓模型数值求解时，二阶RK格式为

式中：

三阶RK格式为

Runge-Kutta方法是求解非线性微分方程的重要数值迭代方法，是Euler方法的一种推广。它提高了计算收敛精度，缩小截断误差，并且具有更好的稳定性。Runge-Kutta方法的导出基于Taylor展开，对所求问题的解具有较好的光滑度，可以使近似公式达到所需要的阶数，并且能够有效提高方法的精度。计算时使用Euler-Lagrange函数在若干点上函数值的线性组合来构造近似公式，因此会在时间复杂度上造成线性的倍数增加^{[14, 15]}。本文采用的显式二阶三阶Runge-Kutta方法并不会在计算复杂度上造成过多的影响。

对模型中的空间导数项的数值离散采用有限差分方法。本文选择二阶精度的中心差分方法进行数值的近似求解，对φ_i,jⁿ进行半点中心差分，其偏导数为

3 实验与结果分析

本文实验是在Matlab R2011b平台上进行的，所用的计算机系统配置如下：CPU为Intel(R) Core(TM) i5-3470; 主频为@3.20GHz; 内存为4GB; 操作系统为Microsoft Windows7 Professional。实验选用的素材参考文献^[11]，采用的评价方法参考文献^{[12, 13]}。

3.1 LBF模型的参数讨论

第1部分的参数讨论分析中，LBF模型对活动轮廓模型Euler-Lagrange函数，即式(14)的长度项光滑项系数nu值，以及时间步长Δt比CV模型，LIF模型更加敏感。因此，本文在式(14)中使用拟合项F^LBF，即式(6)。分别对LBF模型中的不同时间步长Δt和不同光滑系数项nu进行3种数值求解方法的实验讨论。

3.1.1 对光滑系数项nu值的讨论

首先，本文对LBF模型中的时间步长Δt和光滑系数项nu进行讨论。固定时间步长Δt=0.1，对光滑项系数nu=0.001×255×255到nu=0.005×255×255的结果进行讨论。图 1~3中iter为模型迭代次数。观察图 1~3( 79×75)可知，Euler方法、二阶RK方法、三阶RK方法在nu≤0.001×255×255时，实验分割结果不稳定，会造成图片左侧的误分割现象；而当nu＞0.005×255×255时，实验的分割结果会陷入局部极小值，不能对图像完全分割；而当值处于0.001×255×255＜nu＜0.005×255×255之间的稳定区域间时，可以明显看出，三阶RK方法比二阶RK方法和Euler方法能够在更少的迭代次数内得到图像的准确分割。

图 1 显式Euler方法的图像分割结果Fig. 1 Segment results by explicit Euler method

图选项

图 2 RK-2方法的图像分割结果Fig. 2 Segment results by RK-2 method

图选项

图 3 RK-3方法的图像分割结果Fig. 3 Segment results by RK-3 method

图选项

3.1.2 对光滑系数项nu值的讨论

固定光滑项系数nu=0.003×255×255，对Δt=0.01,0.05,0.1,0.2,0.3的实验结果进行讨论。本文选取比较有代表性的4个时间步长，对不同时间步长下的Euler方法、二阶RK方法、三阶RK方法进行讨论分析。观察图 4~6(size 127×96)，当Δt=0.01时，三阶RK方法需要迭代800次才能得到最终的结果，而当Δt=0.05,0.1,0.2时，迭代次数依次递减。而当Δt>0.2，取Δt=0.3时，3种方法都不能得到图像的正确分割结果。综合考虑，本文所使用的RK3方法在稳定区域内，不同的时间步长下，均能在更少的迭代次数内得到正确的分割结果。

图 4 显式Euler方法的图像分割结果Fig. 4 Segment results by explicit Euler method

图选项

图 5 RK-2方法的图像分割结果Fig. 5 Segment results by RK-2 method

图选项

图 6 RK-3方法的图像分割结果Fig. 6 Segment results by RK-3 method

图选项

3.2 不同灰度图像分割实验结果分析

在第2部分实验中，本文分别讨论使用LIF模型中的局部信息拟合项F^LIF和全局信息拟合项F^CV时，对强度不均匀的图像和一般灰度图像的3种数值求解方法的进行分析。

3.2.1 局部信息拟合项对强度不均匀图像的分析

实验中所选图例均为图像分割实验中的经典图例。在对强度不均匀图像的处理中，本文选择LIF模型中的考虑局部信息的拟合项F^LIF，其形式与式(6)中的F^LBF拟合项格式相同，在最后采用高斯滤波器，使得模型对噪声具有较好的鲁棒性和平滑性。参数设置时，统一设置时间步长Δt=0.1，光滑项系数nu设置为4幅图像的经验参数中的最优参数：(a)nu=0.003×255×255，(b)nu=0.002×255×255，(c)nu=0.001×255×255，(d)nu=0.001×255×255。

通过观察图 7~9可知，在有限的迭代次数下，二阶RK方法均能更快地得到最终解，其中RK-2方法的收敛速度也明显优于Euler方法；而对比表 1中数据可知，由于二阶、三阶RK方法的计算复杂度上比Euler方法更高，二阶RK及三阶RK方法整体运行时间上略慢于Euler方法。然而其收敛速度，精确度均比Euler方法更好。

图 7 显式Euler方法的图像分割结果Fig. 7 Segment results by explicit Euler method

图选项

图 8 RK-2方法的图像分割结果Fig. 8 Segment results by RK-2 method

图选项

图 9 RK-3方法的图像分割结果Fig. 9 Segment results by RK-3 method

图选项

表 1 强度不均匀图像分割运行时间对比Table 1 Running time comparison of inhomogeneous images/s

方法	图3(a)119×78	图3 (b)111×110	图3 (c)103×131	图3 (d)128×128
Euler	0.142	0.435	0.556	0.122
RK-2	0.194	0.731	1.111	0.203
RK-3	0.312	1.100	1.613	0.310

表选项

3.2.2 全局信息拟合项对一般灰度图像的分析

在对一般灰度图像实验分析时，本文使用式(2)的全局信息拟合能量项F^CV，对3幅比较有代表性的一般图像进行实验对比分析。统一设置时间步长Δt=1，光滑项系数nu=0.001×255×255。实验结果如图 10~12所示。

图 10 显式Euler方法的图像分割结果Fig. 10 Segment results by explicit Euler method

图选项

图 11 RK-2方法的图像分割结果Fig. 11 Segment results by RK-2 method

图选项

图 12 RK-3方法的图像分割结果Fig. 12 Segment results by RK-3 method

图选项

从图 10(a)、11(a)、11(a)中可以看出，采用Euler方法，本文二阶、三阶RK方法得到的分割结果类似，均能在2次迭代之后收敛。这里主要是因为图像的分辨率较小且图像自身简单。此时，3种方法均能得到正确结果；再观察图 10(b)、11(b)、12(b)，二阶RK及三阶RK均能得到正确的分割结果，而Euler方法分割不完全，且带有许多不连续点；对含有大量噪声的图 10(c)、11(c)、12(c)，3种模型的抗噪能力均比较差，在迭代20次时，模型分割都带有大量噪点。也表明了本文方法没有在鲁棒性上着重改进。观察表 2可知，当使用全局能量拟合项时，本文二阶、三阶RK模型，与Euler方法运行时间相近，且能得到更准确的分割结果。综上所述，本文方法具有一定的优势。

表 2 一般灰度图像分割运行时间对比数据Table 2 Running time comparison of general gray images /s

方法	图4(e)84×84	图4 (f)128×128	图4(g)256×256
Euler	0.030	0.048	0.302
RK-2	0.034	0.039	0.444
RK-3	0.038	0.041	0.602

表选项

4 结束语

本文使用高阶数值求解优化方法解决水平集变分图像分割问题。通过将二阶、三阶Runge-Kutta方法，与传统Euler方法在基于全局区域信息的CV模型，及基于局部区域信息的LBF、 LIF模型上实验对比分析可知：本文模型对光滑项系数及不同时间步长的情况下，均能更快地得到实验结果，并有效提高了分割的精度。实验结果表明，RK-2、RK-3方法的使用提高了计算精度、减少迭代次数、减小迭代误差，且比Euler方法具有更好地稳定性。然而RK-2、RK-3方法在在计算复杂度上比传统Euler方法较为复杂。因此，从模型和数值求解优化问题相结合的角度出发，如何选择更优的数值求解方法，以得到更优的实验结果，将作为今后继续研究发展的一个方向。

参考文献

[1]	VESE L A, CHAN T F. A multiphase level set framework for image segmentation using the Mumford and Shah model[J]. International Journal of Computer Vision, 2002, 50(3):271-293.

[2]	CHAN T F, VESE L A. Active contours without edges[J]. IEEE Transactions on Image Processing, 2001, 10(2):266-277.

[3]	COHEN L D, COHEN I. Finite-element methods for active contour models and balloons for 2-D and 3-D images[J]. IEEE Transactionson on Pattern Analysis Machine Intelligence, 1993, 15(11):1131-1147.

[4]	LI Chunming, KAO C Y, GORE J C, et al. Implicit active contours driven by local binary fitting energy[J]. IEEE Conference on Computer Vision and Pattern Recognition, 2007:1-7.

[5]	潘改, 高立群, 张萍. 基于LBF方法的测地线活动轮廓模型[J]. 模式识别与人工智能, 2013, 26(12):1179-1184. PAN Gai, GAO Liqun, ZHANG Ping. Geodesic active contour based on LBF method[J]. Pattern Recognition and Aitificial Intelligence, 2013, 26(12):1179-1184.

[6]	ZHANG Kaihua, SONG Huihui, ZHANG Lei. Active contours driven by local image fitting energy[J]. Pattern Recognition, 2010, 43(4):1199-1206.

[7]	刘瑞娟, 何传江, 原野. 融合局部和全局图像信息的活动轮廓模型[J]. 计算机辅助设计与图形学报, 2012, 24(3):364-371. LIU Ruijuan, HE Chuanjiang, YUAN Ye. Active contours driven by local and global image fitting energy[J]. Journal of Computer-Aided Design & Computer Graphics, 2012, 24(3):364-371.

[8]	WANG Xiaofeng, HUANG Deshuang, XU Huan. An efficient local Chan-Vese model for image segmentation[J]. Pattern Recognition, 2010, 43(3):603-618.

[9]	BAR L, SAPIRO G. Generalized Newton-type methods for energy formulations in image processing[J]. SIAM Journal on Imaging Sciences, 2009, 2(2):508-531.

[10]	SCHEUERMANN B, ROSENHAHN B. Analysis of numerical methods for level set based image segmentation[J]. Advances in Visual Computing, 2009, 5876:196-207.

[11]	LI Chunming, KAO C Y, GORE J C, et al. Minimization of region-scalable fitting energy for image segmentation[J]. IEEE Transcations on Image Processing, 2008, 17(10):1940-1949.

[12]	GE Feng, WANG Song, LIU Tiecheng. New benchmark for image segmentation evaluation[J]. Journal of Electronic Imaging, 2007, 16(3):1010-1016.

[13]	任守纲, 马超, 徐焕良. 基于改进主动轮廓模型的图像分割方法研究[J]. 计算机科学, 2013, 40(7):289-292, 296. REN Shougang, MA Chao, XU Huanliang. Improved skeleton extracton algorithm based active contour model research[J]. Computer Science, 2013, 40(7):289-292, 296.

[14]	CORMEN T H, LEISER C E, RIVEST R L, et al. Introduction to Algorithms[M]. 3rd ed. Cambridge, Mass:MIT press, 2009:350-400.

[15]	JOHNSON M L. Essential numerical computer methods[M]. Burlington, MA:Academic Press, 2010:230-275.

DOI: 10.11992/tis.201507037
中国人工智能学会和哈尔滨工程大学联合主办。

文章信息

廖翠萃, 李敏, 梁久祯, 廖祖华

LIAO Cuicui, LI Min, LIANG Jiuzhen, LIAO Zuhua

数值求解优化问题在活动轮廓模型上的应用

Application of a numerical solution to the optimization problem in the active contour model

智能系统学报, 2015, 10(6): 886-892.

CAAI Transactions on Intelligent Systems, 2015, 10(6): 886-892.

DOI: 10.11992/tis.201507037

文章历史

收稿日期: 2015-04-30

网络出版日期: 2015-11-10

文章信息

文章历史

相关文章

工作空间