当前位置:首页 期刊杂志

基于模糊熵和无序理论的图像纹理分析方法

时间:2024-09-03

范 伟,江 昕

(安徽电气工程职业技术学院 a. 自动化与信息工程系;b. 教务处,合肥 230051)

纹理是描述图像分布的重要特征,它广泛存在于自然场景、生物外观和艺术作品中﹒纹理是图像本身固有的,容易辨认却很难定义[1]﹒这是因为不同的人对纹理的理解不同,由于图像强度值在方向和规模上存在很大的局部变化,使得纹理模糊且复杂,因此纹理没有确切的数学定义[2]﹒

纹理分析[3]是图像处理过程中很重要的步骤,已有一些研究学者对此作了相关研究﹒通常,分析纹理主要有3 种途径:数据法、结构法和光谱法[4]﹒数据法将纹理的特征描述为平滑、粗糙和粒状等;结构法用于整理图像基元,如基于规则空间平行线来描述纹理;光谱法是基于图像的频率特征,通过考虑光谱中的高能量和窄峰来全方位测定其周期性﹒文献[5]在图像纹理特征统计分析的基础上,提出了一种基于小波变换纹理分析的图像粗糙度提取方法﹒文献[6]利用分数维将图像的空间信息和灰度信息有机结合,提出了一种基于分形维数的图像纹理分析方法,此法所分割的图像能够体现图像的纹理分布﹒文献[7]研究了基于灰度共生矩阵(GLCM)的14 个纹理特征,分析了纹理特征之间的冗余﹒文献[8]将Haralick 特点应用于医学图像纹理的分析,即利用Haralick 纹理特征归一化灰度共生矩阵不同方向的计算,该方法的核心是组合多个特征进行纹 理分析﹒文献[9]提出了基于Gabor 变换的纹理分析,利用图割提取一些重要的纹理特征,Gabor变换用于分析和分类﹒这些方法[5-9]适用范围较窄,总体误差较大,不确定性难以量化,因此它们在表征纹理特征的方式上有待改进和完善﹒

对于图像纹理分析,信息和不确定性是一个统一的整体,信息中的不确定性使得真实模型既可预测又不可预测﹒这种情况存在于模式识别[10]等复杂问题的处理中﹒目前,对于复杂信息处理中的预测性或不确定性量化问题,主要是基于无序理论[11]﹒无序理论和模糊逻辑均属于模糊数学理论分支,可被用于处理模糊分类、决策和控制等问题,而纹理属性不可预测性的量化正是基于此﹒因此,本文重点研究无序理论和模糊集表达纹理图像强度值分布的空间排列,处理动态不确定性问题,在柯尔莫哥洛夫-西奈(K-S)熵[12-13]的基础上,引入了模糊K-S 熵的概念,并给出了模糊K-S 熵的估计值﹒

1 模糊集的K-S 熵

1.1 K-S 熵

在无序理论分析中,K-S 熵[12]被认为是无序性轨迹产生的最新信息平均时间率的指标,也称为测量-理论熵或测度熵﹒它有3 个重要特征:序列概率、熵率和熵界﹒为了描述动态系统的状态-空间特征,应考虑二维状态-空间区域,即在含有多个小单元的盒子中,小单元边长度为ε ﹒动态系统的轨迹随着时间变化,会在状态-空间区域覆盖一些单元,并扩散﹒就第1 个特征而言,由于K-S 熵测量系统的不确定性,与此系统有联系的时间单元为

其中时间步长或空间步长可以用步长大小来分别体现时间或空间的演化﹒

1.2 模糊集的K-S 熵

基于模糊集熵的概念,模糊系统的不确定性在K-S 熵环境下通过一系列观察测得,定义为

基于现有数学理论的相关文献[14]对K-S 熵函数概率意义的讨论,可以得出,动态系统中随机熵和模糊熵可表述为:模糊熵=高级随机熵﹒在设定模糊集时,嵌入在K-S 熵中的一系列概率和香农熵可分别由模糊隶属度和模糊熵替代﹒概率和模糊度是相关的,但它们的根本概念是不同的:模糊度表示一种确定的未知性,代表一个时间的模糊度,可表示一个事件发生的程度;概率是由一个事件是否会发生而产生的﹒基于式(5),模糊集K-S 熵的表达式为

模糊隶属度的值与式(8)相关,合并条件概率事件的乘法由模糊乘法替代,使之与模糊关系的概念一致﹒令A 和B 为2 个模糊集,每个模糊集都与n 维欧式空间 Rn中的每个x ∈ X相关联,A和B 的乘积为模糊集T=A×B,可利用模糊交叉法定义为

记熵差为m,则有

式(12)表明,在单位时间下计算,平均熵率和熵差会得出相同的平均熵率近似值;但在时间轴下m 的点迹更接近,并快速汇聚于一点﹒运用熵差法,模糊集K-S 熵估计值的计算为

利用式(13)计算模糊集K-S 熵的步骤如下:

1)选定一个单元尺寸ε ;

2)在一个给定的时间步骤下,估算所有可能路径的序列模糊隶属度级别,并计算 Dm;

3)在下一个时间步骤下,重复步骤2,并得出Dm+1;

4)计算熵差m;

5)多次重复步骤2)~步骤4);

6)在时间步骤下描绘出熵差点迹,并估计熵差的近似值;

7)若m 变得近似于一个常量,程序终止,否则进入下一步;

8)重复步骤1)~步骤6)得到越来越小的ε ﹒

本文的重点为构建图像的K-S 熵,利用模糊集和无序理论使传统量化无序性的程序作为纹理分析的一个新特征﹒

2 图像纹理信息的K-S 熵

本节构建用于估算图像模糊信息K-S 熵的模型﹒在很多图像中,表示不同物体的像素很可能具有相似的像素灰度值﹒因此,不清晰物体图像的直方图较窄,清晰物体图像的直方图较宽﹒

由此可知,图像中的不确定性是由图像内容的不精确描述所产生﹒本文使用模糊C-均值算法[15]对图像空间进行数学建模,即用模糊C-均值算法将一个由N 个像素组成的图像任意分离为一系列不精确的簇,表示为

在不精确边界或模糊类的上下文中,基于模糊C 均值(Fuzzy C Means, FCM)的聚类分析可用于建模图像的不确定性﹒选择c 的大小相当于模糊集K-S 熵估计过程的第一步,为了构造出图像的序列隶属度,利用给定的c 进行模糊C-均值划分;计算在每个路径上的模糊隶属度,以最低值所对应的模糊隶属度的灰度级确定FCM(即步骤2 和步骤3);然后计算熵差m(步骤4)﹒为了计算熵差,一个很实用的方法是使用模糊隶属度来处理FCM 所获得的每个集合﹒其中,图像的垂直和水平方向分别指图像中行和列的熵差,如果一个纹理图像是等方向的,那么K-S 熵的计算是独立于图像方向的﹒

3 实验结果分析

3.1 典型纹理图像

图1 给出了4 个实验图像,其中(a)为“Lena”标准灰度图像(512×512);(b)为部分癌细胞图像(603×1819);(c)为部分正常细胞图像(678×1747);(d)为人类腹部器官图像(246×366)﹒

图1 实验图像

图1 中,癌细胞和正常细胞图像可在细胞空腔下通过技术观察得到,人类腹部器官图像则通过CT 扫描获得﹒选择这4 个图像的原因是:Lena图像细节丰富,兼有平坦区域、影子和大量纹理等;2 个细胞图像纹理细节丰富,而纹理分析可用来区分细胞空腔内癌细胞和正常细胞;腹部器官的CT 图像是一个典型的医学图像,也可作为纹理分析的测试图像﹒

图2~图5 分别给出了上述4 个图像所表达的特征,其中,每个原始图像分为25 个大小为128×96 像素的子图像﹒测试中,参数c=2,模糊权重指数q=2﹒

图2 Lena 图像熵差的变化

图3 癌细胞图像熵差的变化

图4 正常细胞图像熵差的变化

图5 腹部器官图像熵差的变化

表1 q=2 时图像模糊集的熵差

表2 q=3 时图像模糊集的熵差

3.2 纹理分类

本文使用的纹理数据库是25 个图像纹理等级的集合,每个等级都由40 个图像样本构成﹒所有图像都是灰度JPG 格式,每个图像尺寸都是640×480 像素﹒图7 给出了纹理数据库中一些典型的图像,每个图像属于不同的纹理等级﹒

图6 Lena 图像退化空间熵差的变化

表3 加噪Lena 图像模糊集的K-S 熵

图7 纹理图像数据库样本

实验中,每个原始图像分为25 个大小为128×96 像素的子图像,模糊K-S 熵值从子图像中提取﹒由上述实验结果分析可知,参数q=2 和c=2所得结果最精确,这种参数组合赋予了4 个模糊K-S 熵值特征向量:2 个行向模糊簇集和2 个列向模糊簇集﹒所提取的K-S 熵再通过LBG 向量量化进行分离[16],其中向量可以分为4、8、16和32 维4 种﹒

本文将小波变换纹理分析[5]、分形理论[6]、多个GLCM 纹理分析[7]、Haralick 多特征组合[8]以及Gabor 变换分析方法[9]进行了对比,分类测试中运用10 倍交叉检验将每个数据集分为10 个大小相同的子集,生成的9 个子集用于测试剩下的子集,通过10 次重复计算得出平均精确度﹒各方法的纹理分类准确率情况如表4 所示﹒

表4 几种纹理图像分类准确率对比 %

从表4 可以看出,本文方法的分类准确率最高,其次是GLCM 纹理分析方法,GLCM 及其改进方法对纹理周围8 个方向均有比较敏感的特征反应;直方图分析纹理有明显的缺陷,因为直方图很难给出空间的灰度变化特征,只能给出一块区域的统计特征;分形理论法由于其分形的固有属性,对类似遥感图像的纹理分析更佳;小波变换法以及Gabor 变换法对环境变化的不变性较好,但会错失一些信息,特征点的提取对结果影响较大;Haralick 多特征组合法在理想状态下,可以获得非常好的结果,但这些特征组合经常带有一些确定性因素﹒

为便于比较,本文还使用了k-NN 分类器进行分类,k-NN 分类器是较为简单的非参数方法,不同于FCM﹒2 种方法对比结果如表5 所示﹒

表5 2 种方法的k-NN 分类精度对比 %

从表5 可以看出,本文的方法具有一定的优势,说明K-S 熵在处理不确定的图像纹理分析中是一个有效特征﹒

4 结论

在无序理论和模糊集框架下,提出了一种计算K-S 熵的方法,使用队列元素等级来测定不精确系统的熵率,用模糊度取代确定性范式,将其用于纹理图像的分析和分类﹒结果表明,模糊K-S 熵能较好适用于不同类型纹理的图像分析﹒

由于K-S 熵是一个表达图像空间分区模糊隶属度非线性特征的数值,其延伸模型可有效分析模式识别问题中的不确定性﹒因此,下一步的研究会将K-S 熵应用到具体的模式识别问题中,如高光谱图像等﹒

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!