当前位置:首页 期刊杂志

基于卷积稀疏编码和分数阶变分模型的图像分解

时间:2024-05-04

刘明明

(四川大学电子信息学院,成都610065)

0 引言

图像分解的目的是分离图像中的不同特征。在医学图像处理、遥感、生物计量学等许多实际应用中具有重要的应用价值。图像可以分解为卡通(分段平滑)和纹理结构的叠加。图像可以分解为卡通(分段平滑)和纹理结构的叠加。模型化为f=u1+u2,其中f为观测图像,u1为卡通部分,由分段光滑的结构和清晰边缘信息构成。u2为纹理结构信息,由图像的纹理信息或者高斯噪声构成。例如,在遥感中,合成孔径雷达图像可以建模为地面反射率场(卡通)与多重反射散斑(纹理)的叠加。

近些年来,基于稀疏表示的方法在图像处理中得到有效的应用。特别地,Starck 等人[1]提出了一种称为形态成分分析(MCA)的方法,该算法在假定不同的形态学成分是完全不同的,在特定的解析字典下的表示是稀疏的,同时这些字典是毫不相干的,即每个特定字典可将其对应的形态学成分稀疏表示,而对其他形态学成分的表示是不稀疏的,通过最小化能量泛函使得结构字典表示卡通结构成分,纹理字典表示纹理成分,最终达到卡通和纹理分离的目的。因此MCA 的性能取决于特定字典的选择。在实践中,离散余弦变换(DCT)或离散正弦变换(DST)对应的字典被用来表示纹理成分。由于小波变换、曲线变换和轮廓变换等都能很好地表现出边缘等几何特征,因此可以用来表示分段光滑分量。然而,由于这些字典不能自适应地随图像的内容和结构而改变,图像恢复和分解的质量依赖于这些稀疏域的选择或字典的构造。

直接从训练中学习字典,而不是使用预先确定的字典(例如DCT 或小波),在许多图像处理和分类问题中,通常能得到更好的表示,从而提供更好的结果[2-3]。另外,多数字典学习方法都是基于图像块进行学习的,这就导致这些方法有相同的移位特性,而卷积稀疏编码(Convolutional Sparse Coding,CSC)方法,可以直接在目标中对平移不变性进行建模[4-5]。CSC 已经被证明在广泛的计算机视觉和图像处理问题上有重要的应用[6-7]。

总变差[8](TV 模型),因为它很好地刻画了卡通形象的分段平滑性征。然而,TV 模型基于梯度定义的,因此对于纹理部分不能很好地刻画,易产生“阶梯效应”与细节模糊等问题。为了解决这一问题,人们提出了许多TV 的变体,比如;自适应二阶广义总变分模型[9](TGV 模型),分数阶变分模型[10-11](FTV 模型)等。目前,FTV 已被用于图像纹理细节的提取和增强方面取得了较好的成果[11-12],这些工作也表明了分数阶变分模型能更好地处理纹理等细节信息。为了取得更好的分离效果,本文中用TV 处理图像分离中的卡通部分(低频部分),用FTV 处理图像分离中的纹理部分(高频部分)。

1 相关工作

1.1 卷积稀疏编码

CSC 假设图像可以表示为一组滤波器及其相应的特征映射之间的卷积的和。

这里y表示输入图像,*表示卷积算子。表示一组滤波器,表示与滤波器相对应的特征图。λ表示正则化参数。文献[13]提出引入了一种基于傅里叶域交替方向乘法器(ADMM)[14]框架来解决CSC 的优化问题。文献[15]提出了一个能处理适当边界条件的柔性框架来解决CSC 优化问题。另外,文献[16]提出一种另一种高效的方法,在空间和傅里叶域中处理CSC 的优化问题。在本文中,我们采用了文献[16]中提出的学习卷积滤波器的方法,该方法简单有效。

1.2 TV模型

TV 模型是的经典图像算法[8],也称ROF 模型,TV的最小能量泛函可以表示为:

min 表示对此模型求最小解,第一项为正则项,作用是在D⋃U区域内的图像总变分求取最优,第二项为保真项,作用是平滑修复区域。u为包含噪声的图像,u0为原始图像。λΩ数据保真项,当有噪声存在时用来保持边缘信息。

(3)式能量泛函的欧拉-拉格朗日方程可以表示为:

其中 |∇u|-1为扩散系数,其作用是修复图像时平衡图像在不同的像素梯度下的扩散强弱,以此来避免图像修复后破损区域与其邻域之间过度的平滑。TV 模型通过梯度值来确定边缘和噪声,仅在图像的梯度正交方向上进行扩散,从而有效地保留边缘结构。但在图像的平滑区域,TV 模型能有效地逼近分段常数函数,容易将噪声误判为边缘保留,最终产生分段区域的“阶梯效应”。

1.3 FTV模型

分数阶微分实质上是整数阶微分的一种推广形式,研究表明分数阶导数比整数阶导数更适合于对于图像纹理等细节信息的处理,能有效的抑制图像的“阶梯效应”将文中TV 模型的正则项由一阶微分拓展到分数阶微分。这样就得到了FTV 模型:

通过引入一个人为的时间变量,求解方程(5),得到了梯度流:

其中的参数含义与TV 模型的参数含义相同。

蒲[12]等人通过Gru¨nwald-Letnikov(G-L)定义构造八个方向的分数阶微分掩模。

s(x)是定义在[a,x] 的连续信号,α是任意的实数,在区间[a,x] 上的离散采样信号。为了简单起见,我们只介绍四个方向的分数阶掩码,包括正的x轴和y轴,负的x轴和y轴用于处理对应的四个方向,由图1 表示。其中的子图分别表示4 个方向的分数阶微分掩模。

图1 四个方向上的分数阶掩模

图1 中分数阶微分掩模的系数如下:

2 本文模型

2.1 卷积稀疏编码

y为输入大小为N2的图片,可以分离为分段光滑的可用卡通图片yc和纹理图片yt。假设我们已经分别解决了动画和纹理组件的CSC 问题,学习了对应于yc和yt的卷积滤波器,用学习得到的得到,基于CSC 优化框架来优化uc,i和ut,i来估计yc和yt。

其中λc,λt是稀疏系数,β,γ是平衡系数。对于卡通部分uc,用刻画。对于纹理部分,用刻画,则(9)式又可以表示为:

2.2 模型分析

为了简化计算,我们可以在这里先讨论除了TV 和FTV 的部分,得到的结果可以在uc,k和ut,k上进行迭代求解。首先更新uc,k,我们假设初始ut,k是固定的,因此,需要解决以下的优化问题:

这里假设dc,k,dt,k和ut,k是确定的,(10)式本质上是一个稀疏编码问题,可以使用[17]中提出的基于DFT的ADMM 的算法来解决。

其次更新ut,k,这里我们假设uc,k事先确定,然后解决如下优化问题:

同样的,(11)式可以基于DFT 的ADMM 的算法来解决。

2.3 算法

图像分解的本文算法:

这里的λc,λt,β是正则化参数,K是总的迭代次数,y为待分离的图像为处理后的图像分离卡通和纹理图像。

3 实验结果

3.1 卷积滤波器的选取

这一部分,用我们提出的新的图像分离算法与基于卷积稀疏编码的分离算法[18](CSCD)、经典的形态成分分析(MCA)的方法[1]以及一种最新的基于块的核范数的图像分离算法[19](BNN)。在这些实验当中,我们用峰值信噪比来衡量各自的性能。对于MCA 算法,用小波变换和局部DCT 字典分别表示卡通和纹理成分。为了更好的说明本算法的实验效果,本文采用与CSCD算法相同的卷积滤波器,采用文献[20]CSC 算法模型分别进行处理,得到相应的学习滤波器如图2 所示。

图2

从图2(a)可以看出,这些过滤器本质上是振荡的,它们在捕获训练纹理的模式方面做得很好。类似地,从图2(b)中,我们观察到所学的过滤器与在Gabor 字典中发现的过滤器相似。此外,它们还可以捕获在卡通类型图像(如边缘)中发现的特定于域的信息。

3.2 实验及结果分析

在第一组实验中,我们提出了一种从隐藏的指纹中提取潜在指纹的方法。潜指纹是最有价值和最常见的物证类型之一,从犯罪现场提取的潜指纹可作为法医鉴定的重要依据。参数的选取经常是根据经验确定的,在该实验中取λc=max(0.5-0.05∗i,0.05)和λt=max(0.55-0.05∗i,0.15),在第i 次的迭代当中分数阶的模板大小为N=7,分数阶的阶次V=0.6。本文所提出的方法从隐藏指纹中提取潜在指纹。图3 给出了本文算法的分离结果。同时与CSCD、BNN、MCA 等算法简单的对比。

图3 本文算法与CSCD,BNN,MCA在隐藏指纹图像上分离效果的对比

在第二组实验中我们采用猫+笼子图像原始图像,为了增加本文算法的说服性,本文选取与CSCD 相同的 参 数。 取λc=max(0.55-0.05∗i,0.005)和λt=max(0.55-0.05∗i,0.005)在的第i次迭代中。分数阶模板大小为N=7,分数阶的阶次V=0.8。在这两个图中,第一列显示了原始的测试图像卡通形象和原始纹理形象,第二列显示本文的图像分离算法。第三、第四和第五列显示的结果对应的分别采用CSCD 算法、BNN 算法、MCA 算法。采用峰值信噪比(PNSR)来比较不同算法的效果。

与其他方法相比,我们的方法能够较好地从给定的图像中分离出形态成分。猫+笼子图像的实验可以看出,如图4 所示,本文算法分离出来的卡通图像的PNSR 为29.33,与之相对应CSCD 算法,BNN 算法,MCA 算法的PNSR 分别为28.43,28.12,26.82。相应的分离出来的纹理图像的PNSR 为28.97,与之相对应CSCD 算法,BNN 算法,MCA 算法的PNSR 分别为28.21,26.32,26.47。总的来说,本文的方法在两种分离后成分相结合的情况下,得到了38.43dB 的PSNR,略低于CSCD 算法的PSNR,明显高于BNN 和MCA 的PSNR。

图4 本文算法与CSCD,BNN,MCA在猫+笼子图像上分离结果的对比

4 结语

本文提出了一种新颖的图像分离方法,将给定的图像分解为纹理和卡通部分。我们的方法是直接训练卡通和纹理过滤器。利用这些学习滤波器,然后基于一个稀疏的图像分离优化框架。通过对一幅图像进行分解使得其分解为卡通和纹理两个部分,然后分别对这两部分进行处理,即卡通对应着目标图像的低、中频部分,用变分模型进行处理,而纹理则对应其高频部分,因此利用对细节部分有增强效果的分数阶变分模型对其进行处理。实验结果表明,由于引入了分数阶变分模型,本文算法成功地将结构、纹理,更好地实现了图像的分解。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!