时间:2024-07-06
徐伟华,李泽峰,黄旭东
(西南大学 人工智能学院,重庆 400715)
1982年波兰数学家Z.Pawlak[1-2]发表经典论文Rough sets,标志着粗糙集理论的诞生。粗糙集已经逐渐成为人工智能中的一个重要分支[3]。近年来粗糙集理论广泛应用于各个领域,如计算机网络[4]、图像处理[5]、数据挖掘[6]和医学科学[7]等。由于经典的Pawlak粗糙集理论需要严格的等价关系,因此只能挖掘具有分类属性的信息系统中的知识。为了处理其他属性的信息系统,研究人员将邻域关系、模糊等价关系、优势关系和相似关系引入到了Pawlak粗糙集中,建立了邻域粗糙集[8]、模糊粗糙集[9]、基于优势关系的粗糙集模型[10]和基于相似关系的粗糙集模型[11]。这些广义粗糙集模型已广泛应用于属性约简[12-14]、规则提取[15]、决策理论[16-17]、增量学习[18]等。
属性约简是粗糙集理论中一个重要的研究范畴[3,19-20]。属性约简的原则是在不削弱分类器的分类能力的情况下,删去不重要的属性。通过删去不重要的属性,可以减少数据的计算量,提高运算效率。目前,很多学者提出了一些新的属性约简算法,例如Hu等[21-22]提出的基于邻域粗糙集模型的属性约简算法和基于模糊决策系统可分性的快速鲁棒属性约简,Chen等[23]提出的区间值决策信息系统下的属性约简算法等。
在实际生活中,许多复杂问题都是基于模糊序关系的,甚至是不协调的。信息系统的序关系不同于等价关系的划分,其结果往往对对象形成的是覆盖而不是划分。另外,不协调系统是指基于条件属性和决策属性所做出的样本分类不一致的系统。因此,从这些复杂的信息系统中提取有效的确定性命题,属性约简是非常有必要的。在属性约简的过程中,人们往往对于部分关键属性有所偏好。为了深入刻画这一概念,本文在模糊序关系的基础上,提出了属性权重向量的概念,并利用属性权重向量对关键属性值的影响力进行加强,研究了这一复杂信息的分配约简,所获结果进一步丰富了粗糙集理论。
决策信息系统是由若干个条件属性和若干个决策属性组成的一种特殊的信息系统,其所研究的主要问题即为条件属性和决策属性之间的关系。下面将给出一些基本概念。
定义1[19]设I=(U,AT,DT,F,G)是一个5元决策属性系统;(U,AT,F)为3元信息系统。其中:称AT为有限条件属性集AT={a1,a2,…,an},DT为目标属性集DT={d1,d2,…,dm},U是有限对象集U={x1,x2,…,x|U|},F是U与AT的关系集,F={fk;U→Vk|k≤n},Vk是ak的有限值域;G是U与DT的关系集,G={gi;U→Vi|i≤m}};Vi是di的有限值域。
定义2[24]设I={U,AT,DT,F,G}为决策信息系统,如果对任意f∈F,g∈G,a∈AT,以及∀d∈DT,x∈U都有
f(x,a)=μa(x),
g(x,d)∈R(R为实数集),
其中,μa∶U→[0,1]称为x∈U在条件属性a下的隶属度。则称满足上述条件的I为模糊决策信息系统,用I+={U,AT∪DT,F,G}表示。
定义3设WT={w1,…wn}为对应的条件属性a(∈AT)所对应的权重,其中:对于∀wt∈Wt,有wt≥0,并且须满足w1+w2+…+wn=1。下面给出A(⊆AT)的得分函数KA(x)的定义为
其中:J=|A|表示集合A中的元素个数,μt=f(x,a),a∈A。
当一个条件属性越重要时,它所对应的权重值也就越大;反之,它所对应的权重值也就越小。
定义4[19]设I+={U,AT∪DT,F,G}是一个模糊决策信息系统,对于∀g∈G,∀a∈AT,∀d∈DT,∀xi,xj∈U,都有
f(xi,a)≥f(xj,a)↔Ka(xi)≥Ka(xj),
g(xi,d)≥g(xj,d),
则称该系统为模糊序决策信息系统。
在条件属性a的值域中可能存在递增的偏序关系,也可能存在递减的偏序关系。如果在某一个条件属性的值域中存在递增或递减的偏序关系,则称此条件属性为模糊决策信息系统的一个准则。全部的准则构成的集合称之为准则集。
下文中,只讨论由递增偏序关系构成的优势关系。
下面在带有属性偏好的模糊序决策信息系统中给出的优势关系为
例1表1给出了一个带有属性偏好的模糊决策信息系统。U={x1,x2,…,x6},AT={a1,a2,a3},DT={d},WT={w1,w2,w3},其中:w1=0.5,w2=0.3,w3=0.2。
根据带有属性偏好的模糊优势关系的定义可以得到:
下面给出带有属性偏好模糊序决策信息系统的分配函数的定义。
例2根据表1给出的带有属性偏好的信息系统计算分配约简,记:
则有:
证明必要性:反证法。
证明必要性:
充分性:
由上面定理3和定义8有下面结论。
例3对于表1给出的带有偏好的模糊决策信息系统,接下来计算其分配辨识矩阵(见表2)。
由定理4可得
由以上公式可知该系统的分配约简与例2中的结果是一致的。
现实生活中,决策者对系统的每个属性可能具有不同重视程度。为此,本文在模糊序决策信息系统中结合权重向量的概念,对每个属性赋予合适的权值,建立了一种新的权重函数。进一步,提出模糊序决策信息系统的分配约简,并给出其判定定理和求解方法。最后,通过实例验证了该方法的有效性。然而在具体的应用中,主要的分配约简方法还是依靠专家系统的数据和决策者自身经验给出属性的重要程度。如何科学的给出属性的权重向量将是下一步研究的主要课题。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!