时间:2024-05-04
许超
(商洛学院 陕西省商洛市 726000)
图像分割是识别图像中的对象并在所识别的对象之间形成上下文关系的基础。模糊C 均值聚类算法是图像分割中的经典聚类算法之一,用于获得源图像的颜色量化版本,以进一步分割图像。在图像分割领域中应用模糊C 均值聚类算法会产生许多固有的复杂性,首要问题之一是预先指定簇的数量,其他问题包括由于随机选择初始中心,FCM 会陷入局部最优。为了解决这个随机初始化问题,目前已经提出了许多基于进化算法的研究。J.Kennedy 和Russell 提出了一种基于群体智能的优化算法[1]。此后,Omran 等人将此粒子群优化算法(PSO)应用于图像分类[2]。 近年来,PSO 的混合版本(包括速度和位置计算的优化)与原始PSO 相比具有更好的性能。高尚等人使用PSO 的输出来初始化K 均值聚类算法,并获得了更好的结果[3]。他还证明,与K 均值聚类算法+ PSO 组合相比,PSO + K均值聚类算法组合是更好的选择。李海阳等人在PSO 的连续迭代中更新惯性权重时使用了相同的方法[4]。本次研究以模糊C-均值代替K 均值来进一步改善图像分割效果。通过与自适应粒子群优化算法相结合,模糊C 均值算法将改善图像分割效果,因为它用隶属度值来分类数据点,而不是像K 均值那样严格的0 或1 对数据点进行分类。
Bezdek 等人引入的模糊C 均值算法根据目标函数将数据点xi,i=1,2,3,...分组为C 群集。
其中,cj代表jth簇的原型值,uij是cj在簇j 中的隶属度,m 是任何大于1 的实数。为了最小化目标函数,将高隶属度值分配给这些像素,这些像素的强度位于其簇的原型值附近。其中uij用(2)式计算,cj用(3)式计算。
当Jm的值在后续迭代中停止变化时,该算法收敛。J.Kennedy和Russell 引入粒子群优化算法,将问题的最优解抽象为在N 维空间中飞行的无质量、体积的粒子。一组粒子称为粒子群或简称为“群”。每个粒子都有自己的飞行速度,空间位置和适合度值。假设粒子i 在d 维空间中的位置为Xi=(xi1,xi2,...,xid),速度为Vi=(vi1,vi2,...vid)。在迭代过程中,当前的个体最优解p-best是Pi=(pi1,pi2,...,pid),当前的全局最优解g-best 是Pg=(pg1,pg2,...,pgd)。可以分别使用(4)式和(5)式计算粒子的速度和位置。
其中w 是惯性权重,它代表继承到下一飞行速度的当前飞行速度的数量。c1代表粒子的自我学习能力,c2代表粒子的社会学习能力。在PSO 算法中,c1和c2是常数,其值在0 到4 之间。通常,c1=c2=2.0。r1和r2都是在0 和1 之间均匀分布的随机数。李海阳等人在PSO 中使用了动态惯性权重的概念[4]。在本次研究中,我们扩展了这种想法以实现更好的分割效果。通过动态改变惯性权重可以提高粒子群优化算法的性能。保持惯性权重不变可能导致算法收敛于局部最优解,线性减小的惯性权重甚至可能超出最优点。为了克服这些缺点,可以使用(6)式动态计算惯性权重。
图1:三种算法的图像分割结果
其中wmax是最大惯性权重,wmin是最小惯性权重。f 是粒子i的当前适应值,favg是群的当前平均适应度,fmin是群中所有粒子的最小适应值。该方法具有以下优点:
(1)适应值小于平均适应值的粒子被赋予较低的惯性权重,从而降低飞行速度以保持其位置。
(2)适应值大于平均适应值的粒子被赋予更高的惯性权重,从而提高飞行速度,以快速靠近其最适合的邻居。
粒子群算法的两个学习因子通常是常数。分配给这些因子不适当的值可能会导致不期望的输出。为了得到更好的结果,我们分别使用(7)式和(8)式计算了学习因子c1和c2。
为了初始化群体,在图像X 的N 个总像素中随机选取M 个像素成为初始聚类中心,作为优化问题的解集。确定聚类中心后,图像X 中的剩余像素应根据以下聚类准则分配给这些M类。设xi为数据点集X 中的ith数据点,且cj为jth簇中心。如果则将xi分配给jth簇。粒子的适应度使用以下公式进行评估:
式中,fi表示粒子i 的适配度,N 为像素总数,M 为解集中粒子的数目,xi代表ith像素,cj为jth簇中心。群的平均适应度favg计算如下:
群的收敛程度可以通过计算群适应度方差δ2来测量,如下所示:
在优化过程中,粒子适应度将逐渐趋于相同。当发生这种情况时,该算法被认为是收敛的,并且群体适应度方差δ2将减小到某个范围,这意味着该算法已经接近全局最优解。该最优解作为FCM 算法的初始聚类中心。
使用Berkeley 分割数据集和基准测试的图像对APSOF 算法进行了测试,这是一个应用于图像分割的标准数据集。此数据集中的大多数图像都是真实的图像,并已调整大小以减小文件大小。在本文中,从所有测试图像中选择了四个图像进行深入分析。为了比较结果,采用了两种经典的聚类算法,即K 均值聚类算法和模糊C均值聚类算法。簇的初始数目根据图像的不同而不同,通常最多在5 到10 个簇之间。在模糊C 均值算法和APSOF 中,m 的值为2。分割结果如图1所示。APSOF 的性能可以从两个方面进行分析:定性分析和定量分析。具体情况将在以下各节中介绍。
定性分析基本上是基于识别图像中感兴趣的区域或对象的能力,通过肉眼观察来评估图像质量。从图1 中,我们可以容易地推断出,APSOF 的分割结果比K 均值和模糊 C 均值有优势(表1)。
我们将逐幅图像进行分析,得到分割图像的视觉差异。
从图1 的第一行(即人脸),我们可以看到,与其他图片相比,APSOF 中眼睛和嘴巴附近的部分与面部其余部分有很好的区别。另外,在APSOF 中,背景伪影,特别是人脸左侧的背景伪影被清晰地分割出来,而在其他算法的分割结果中却并不清楚。
表1:模糊C 均值和APSOF 的标准化Jm 值
图1 的第二行(即花朵),可以观察到,与趋向于较暗色调的模糊C 均值相比,APSOF 的输出中的颜色是明亮和充满活力的。在这种情况下,K 均值完全失去了背景色。
对于如图1 第三行所示的金字塔图像,APSOF 算法在金字塔顶部和云层左端的区域具有最好的分割效果。模糊C-均值将金字塔顶部误归类为云的一部分。尽管K 均值具有与APSOF 相似的结果,但它在金字塔和云的角部分的像素分类方面表现不佳。
对于图1 第四行所示的老鹰图像,除了图像中下半部分附近的斑点可以忽略之外,所有的算法都产生了相似的分割结果,因为它们对于整个图像没有太大的意义。
综上所述,通过定性分析可知,APSOF 算法的性能明显优于K 均值和模糊C 均值算法。
利用两种算法的最终Jm值,可以比较APSOF 和模糊C 均值的性能。为了便于比较,通过将每个单独的Jm值除以每个输出的两个Jm值的平均值来对这些值进行归一化。根据表1 中提供的信息,在大多数情况下,通过使用APSOF,Jm可以最小化。对于老鹰的图像,由于APSOF 和模糊C 均值的分割输出基本相似,所以在Jm值上只有很小的差别。
模糊C 均值算法是一种标准的图像分割算法,但对初始化比较敏感。像APSOF 这样的混合算法可以改进标准的模糊C 均值算法以获得更好的图像分割。性能比较表明,该算法优于K 均值和模糊C 均值,但是计算成本较高。为了满足实时应用的需要,需要提高APSOF 的效率。在以后的工作中,可以将空间信息结合起来,进一步提高分割效率,增强算法对图像数据中噪声的敏感性。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!