Corresponding author: YU Xiao-sheng, E-mail: yuxiaosheng7@hotmail.com
图像分割是图像处理和计算机视觉领域的基础研究课题,活动轮廓模型[1]作为这个领域的重要工具之一,一直受到人们的极大关注.
活动轮廓模型的基本思想是在图像域中定义一条曲线,曲线在图像数据的约束下进行演化并最终停止在目标的边缘上,实现图像分割.根据源于图像数据的约束条件,活动轮廓模型可以分为两类:基于边缘的活动轮廓模型和基于区域的活动轮廓模型;两类模型各有优缺点,需要根据待分割目标的特点进行选择.本文讨论基于边缘的活动轮廓模型.
测地线活动轮廓模型[2](geodesic active contour,GAC)是一种经典的基于边缘的活动轮廓模型.GAC模型利用图像的梯度信息推动活动轮廓演化,使活动轮廓从远离边缘的位置向目标边缘逐渐逼近并最终停止在边缘上.GAC模型的一个主要缺陷是对轮廓初始化敏感,初始轮廓线必须完全包围目标或者完全在目标的内部或外部,这极大地限制了GAC模型的应用.针对上述问题,有多种改进方法[3, 4, 5].Paragios等[3]应用梯度矢量流[6](gradient vector flow,GVF)作为轮廓演化的驱动力,提出了一种梯度矢量流测地线活动轮廓(gradient vector flow geodesic active contour,GVFGAC)模型.GVF是一个双向的力场,可以使活动轮廓从边缘的两侧向边缘演化.但是GVF力场中存在许多临界点[5],使得GVFGAC模型仍对初始轮廓较为敏感.受GVFGAC模型启发,研究人员提出了不同的外力场来驱动活动轮廓演化,其中,Xie等[5]根据静磁场对电流的作用原理来模拟目标边缘对活动轮廓的作用力,构建了一种静磁场力,提出了静磁场活动轮廓(magnetostatic active contour,MAC)模型.MAC模型对初始轮廓的敏感性较低,能够处理具有弱边缘和复杂形状的目标,在实际应用中,取得了很好的结果.尽管如此,这些模型在活动轮廓整个演化过程中,水平集函数需要重新初始化,这导致活动轮廓演化速度较慢.在文献[7, 8]中提出了一些快速有效的数值方案,解决了水平集函数周期性初始化问题,但都不适用于这些模型.
本文提出一个基于边缘扩散信息拟合的测地线活动轮廓模型.该模型对初始轮廓不敏感,活动轮廓演化速度快,能够分割弱边界目标、复杂几何结构的目标和带有孔洞结构的目标,综合性能优于一些传统算法.
1 GAC模型GAC模型是一种经典的基于边缘的活动轮廓模型,它是在Snakes[1]模型的理论基础上提出的,其能量泛函形式定义如下:
由式(4)可知,活动轮廓演化时受到三种力的支配:k为曲率平滑约束力,它源于活动轮廓自身,保证了活动轮廓演化过程中时刻保持光滑;a为气球力,使活动轮廓可以通过收缩(或膨胀)的方式向真实目标边缘逼近,它们的强弱受到边缘停止函数g的控制;∇g · N 源于图像,是一种双向力,仅在目标边缘附近有意义,其作用是推动活动轮廓向目标边缘靠近并停止在边缘上.活动轮廓在三种力的作用下演化,当三种力达到动态平衡时,活动轮廓收敛.
2 基于边缘扩散信息拟合的测地线活动轮廓模型 2.1 边缘扩散信息拟合力GAC模型的一个主要缺陷是它对初始轮廓敏感,即初始轮廓必须完全处于真实目标的内部或外部.这是因为作为活动轮廓演化主要推动力的气球力是一个单向力场,使得活动轮廓只能同时收缩或膨胀.当活动轮廓初始位置同时位于目标区域和背景区域时,这种单一演化方式使GAC模型无法准确收敛到目标边缘.
针对上述轮廓初始化情况,为了有效分割图像中的目标,位于目标区域的轮廓线和位于背景区域的轮廓线应采用截然相反的演化方式,即如果位于目标区域的轮廓线向外膨胀,那么位于背景区域的轮廓线则向内收缩,反之亦然.图 1展示了这种理想化的活动轮廓演化方式.图中白色圆形区域为目标区域,其他区域为背景区域.为实现上述演化方式,驱动GAC模型演化的外力场在目标区域和背景区域需要具有相反的符号.
沿图像边缘法线方向的二阶导数INN 是一种广泛应用的边缘描述子[9],它能够较好地捕获弱边缘,其在边缘两侧具有相反的符号,本文采用扩散的方法将INN的局部符号信息扩展至整个图像域:
u表示图像边缘扩散信息,它是通过偏微分方程(5)对沿图像边缘法线方向的二阶导数INN进行扩散得到的,在目标区域和背景区域具有相反的符号.g和h是两个权值函数,k′是梯度阈值.g是关于图像梯度模值的单调递减函数,h是关于图像梯度模值的单调递增函数.在图像的边缘,g较小,降低了扩散速度,h较大,增加了(u-INN)的权重,INN得到了有效的保护.在图像的平坦区域,g较大,增加了扩散速度,能够快速将INN的局部符号信息扩展至全局.u可通过对式(5)迭代求解获得.
在上述工作的基础上,本文提出一个边缘扩散信息拟合力,定义如下:
在变分水平集算法框架下,GAC模型能量泛函重新定义为
与GAC模型相比,本文模型采用边缘扩散信息拟合力作为活动轮廓演化的主要推动力.边缘扩散信息拟合力是一个双向的全局力场,可以使活动轮廓同时从边缘的两侧向目标边缘逼近,直至收敛;边缘扩散信息拟合力对弱边缘具有较好的鲁棒性,在弱边缘的两侧力场是截然相反的,使得活动轮廓能够准确地停止在弱边缘上.
为了保证活动轮廓演化的稳定性,防止水平集函数在靠近边缘时变得太陡或太平坦,传统水平集方法需要将水平集函数初始化为一个符号距离函数,并且在活动轮廓的整个演化过程中,水平集函数必须周期性地重新初始化为符号距离函数,这极大地增加了计算量和计算复杂度.现有的许多重新初始化方法会导致负面效果,如牵引零水平集远离边界,很难判定何时进行重新初始化[7].针对上述问题,研究人员提出了许多解决方案[7, 8].其中,Li等[7]提出了一个距离正则化水平集演化方法,通过在活动轮廓模型的变分水平集[10]公式中引入一个距离正则化项,使水平集函数不必初始化为一个符号距离函数,在整个演化过程中无需重新初始化,并且可以采用更大的时间步长提高演化速度.因此,鉴于DRLSE方法在数值求解过程中的优势,本文模型予以采用.式(11)引入一个距离正则化项,同时为实现泛函各项之间的平衡,在曲线加权长度约束项中引入调节参数λ,式(11)重写为
采用梯度下降法最小化能量方程EDGAC,得到如下演化方程:
对式(13)进行迭代求解即可获得最终的分割结果.
本文算法具体步骤描述如下.
步骤1 使用高斯滤波器对图像进行平滑处理,降低噪声的干扰.
步骤2 初始化水平集函数φ(x):
步骤3 根据式(5)计算图像边缘扩散信息u.
步骤4 根据式(13)演化水平集.
步骤5 判断水平集函数是否收敛,本文采用文献[11]中方法作为收敛条件判断,定义如下:
用本文提出的模型分割不同类型的图像,并与GAC模型和GVFGAC模型的分割结果比较,验证算法的有效性.实验平台为Windows XP的PC(Intel D820 CPU/2GB内存),实验中所有模型的仿真程序均为Matlab编写.GAC模型和GVFGAC模型演化过程中,采用二阶基本无震荡差分格式(ENO2)计算重新初始化的水平集函数.
对于本文所有的实验,有如下参数可以固定:时间步长Δt=5,正则化参数ε=1.5,常数力b=3,曲线长度项参数λ=5,距离正则化项参数μ=0.4.梯度阈值k′需要根据不同的图像设定不同的数值.
图 2为使用上述3种模型分割一幅灰度均匀的人工图像的实验仿真结果.人工图像中包含4个独立的不规则几何形状.如图 2a所示,本次实验的初始轮廓是一个以图像中心位置为圆心的圆形,轮廓与这4个目标接触.图 2b为GAC模型的分割结果,可以看到由于初始轮廓同时位于目标和背景区域,活动轮廓没有收敛,分割失败.图 2c为GVFGAC模型的分割结果,从图中可以看出,GVF力场的临界点阻止了活动轮廓继续向目标边界演化,导致图像分割结果不理想.图 2d为本文模型的分割结果,本文模型对轮廓的初始化不敏感,轮廓最终准确地停止在目标的边缘上,分割效果理想.
图 3展示3种模型分割弱边缘图像的能力.图中目标是一个部分边缘模糊的圆形,几何结构特征不明显.为了使上述3种算法的比较有意义,将初始轮廓的位置设置在目标的内部,使活动轮廓的演化结果不受初始轮廓位置影响,如图 3a所示.从图中可以看出,GAC模型在一些弱边缘处发生了边缘泄露,没有收敛到期望的边缘;GVFGAC模型和本文模型有效地克服了弱边缘的干扰,演化的轮廓最终准确地停止在目标的边缘上,分割效果理想.
图 4,图 5展示了3种模型分割带孔目标和具有复杂几何结构目标的能力.如图 4a所示,图中目标含有两个圆形孔洞,将初始轮廓的位置设置在目标和孔洞之间.从图 4b~4c可以看出:GAC模型无法分割带孔目标,GVFGAC模型受GVF力场的临界点影响,图像分割结果不理想;本文模型都准确地分割了目标的内轮廓和外轮廓,分割效果理想.图 5包含4个独立的具有复杂几何结构的形状,这几个形状中包含大量的孔洞,初始轮廓是一个以图像中心位置为圆心的圆形(图 5a),与这4个目标相互接触.从图 5b~5c可以看出:GAC和GVFGAC模型都无法准确分割这些复杂几何形状;图 5d为MAC模型和本文模型的分割结果,4个目标均被准确地分割出来.
本文提出了一个基于边缘扩散信息拟合的测地线活动轮廓模型.本文模型能够灵活地设置初始轮廓,准确快速地分割弱边界目标、复杂几何结构目标和带有孔洞结构的目标,综合性能优于一些传统算法.
[1] | Kass M,Witkin A,Terzopoulus D.Snakes:active contour model[J].International Journal of Computer Vision,1988,1(4):321-331.(2) |
[2] | Caselles V,Kimmel R,Sapiro G.Geodesic active contours[J].International Journal of Computer Vision,1997,22(1):61-79.(2) |
[3] | Paragios N,Mellina-Gottardo O,Ramesh V.Gradient vector flow fast geometric active contours[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(3):402-407.(1) |
[4] | Jalba A,Wilkinson M,Roerdink J.CPM:a deformable model for shape recovery and segmentation based on charged particles.[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(10):1320-1335.(1) |
[5] | Xie X H,Mirmehdi M.MAC:magnetostatic active contour model[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(4):632-646.(2) |
[6] | Xu C Y,Prince J.Snakes,shapes,and gradient vector flow[J].IEEE Transactions on Image Processing,1998,7(3):359-369.(1) |
[7] | Li C M,Xu C Y,Gui C F,et al.Distance regularized level set evolution and its application to image segmentation[J].IEEE Transactions on Image Processing,2010,19(12):3243-3254.(2) |
[8] | Bresson X,Esedoglu S,Vandergheynst P,et al.Fast global minimization of the active contour/snake model[J].Journal of Mathematical Imaging and Vision,2007,28:151-167.(2) |
[9] | Osher S,Rudin L.Feature-oriented image enhancement using shock filters[J].SIAM Journal on Numerical Analysis,1990,27:919-940.(1) |
[10] | Zhao H,Chan T,Merriman B,et al.A variational level set approach to multiphase motion[J].Journal of Computational Physics,1996,127:179-195.(1) |
[11] | Wang X,Huang D,Xu H.An efficient local Chan-Vese model for image segmentation[J].Pattern Recognition,2010,43(3):603-618.(1) |