时间:2024-12-22
涂俊翔,朱晓林
(1.福州大学 机械工程及自动化学院,福建 福州 350108;2.福建省制造业数字化设计工程研究中心,福建 福州 350002)
随着经济全球化和网络技术的发展,企业协同制造的需求在迅速提高.越来越多的协作企业依赖于产品生命周期管理(Product Lifecycle Management,PLM)系统为产品设计和制造建立1个并行化的协同环境.然而,由于各企业文化背景不同、产品及零件的命名体系或标准的多样化,不同PLM系统对特定产品和零部件对象、对象属性及对象间关联关系的描述存在着许多差异,极大地限制了协同企业产品信息的检索与共享.
由于在不同的PLM系统中存在着大量语义不一致信息,如果采用人工检索的方法,检索的工作量极大且效率低.在信息的自动检索和匹配方面,国内外学者已经做了不少工作,提出了很多方法[1,2].这些方法大致可以概括为基于名称匹配的方法[3]和基于规则的结构匹配方法[4].基于名称匹配的方法简单易行,在产品成系列化和标准化的企业中能得到很好的运用.但由于这种方法难以辨识异名或语义相近的数据对象,如图1的产品数据描述中,“名称”与“品名”属性,“厂家”与“厂商”属性就属于异名同义;“工业锅炉”与“工业锅炉和生活锅炉”构成泛化关系等,因此基于名称匹配的方法在实际运用中受到了很大限制.如采用基于规则的结构匹配方法,则更有针对性并能取得较好的精度,但它需要人工定义大量的语义转换规则,算法复杂且扩展性不强,在实际PLM系统中难以运用.
Bayes网是人工智能领域用于处理不确定性问题的重要方法[5],本文将其与本体理论结合,提出了1种扩展的Bayes网检索模型.该模型无需构建复杂的语法规则,能在整体结构上对PLM数据对象进行模糊匹配,方便实现自动化检索和大大减少领域专家的参与量.
图1 产品数据描述中的概念差异Fig.1 Different expressions in product description
为便于对协同企业PLM数据对象进行检索和匹配,可预先将PLM系统中对象进行概念化抽象,并对概念、子概念、属性以及关系等进行规范化处理.这个预处理过程即是PLM数据对象的本体化过程.按照Gruber[6]的定义,本体是1个领域或主题范围的概念化,可表示为如下的四元组形式O∶=(C,R,I,A),O为要定义的本体;C为本体中的概念集合;R为概念间的关系;I为实例集合;A为公理断言.依据PLM数据对象检索和信息共享的特点,可认为PLM本体元素主要包括对象名称、属性和关联关系等.对目标PLM本体的检索则可看成是由本地PLM本体到协同企业目标本体的映射,因此有如下的形式化定义:
定义 设o1为PLM本地本体,o2为PLM目标本体.Fm为本体o1到本体o2的映射函数,它可表示为
式中:{e1},{a1},{r1}分别为o1中对象名称、对象属性和关系的集合;{e2},{a2},{r2}分别为o2中对象名称、对象属性和关系的集合.
产品信息的检索和共享过程包括PLM本体导入、对象检索和匹配、匹配关系确认和PLM数据对象整合等4个步骤,如图2所示.
PLM本体的导入是将抽象出来的概念按照主题、维度、类别等层次进行组织,这将方便以后对产品信息进行快速的检索.这里的主题是指从宏观的某个特定方面对PLM数据对象进行描述,如制造企业中物料、产品、文档、人员、组织、设备等主题;维度则是对特定主题进行描述和分类的角度,例如,企业产品管理中零部件主题可以按形状特征维度,也可按制造特征等维度对零部件对象进行描述;类别是按照特定对象的共同特性划分的事物集合,例如,零件可划分为轴类 、箱体类 、齿轮类等类别.另外,对象元素具有属性,并通过属性建立关联关系.
对象检索和匹配是通过建立的Bayes网检索模型,按相应算法对抽象出来的目标PLM本体元素进行检索,自动地发现与本地PLM本体元素相匹配或相似的目标对象,在计算它们的匹配程度之后返回大于阈值的目标对象.
确定匹配关系是在检索到的目标对象中,按照领域约束条件和专家意见最终确定与本地PLM本体元素相匹配的目标元素,并标识它们的匹配关系如泛化关系、等同关系等.
PLM数据对象整合是根据已确定的匹配关系在本地PLM系统中集成协同企业相关的PLM数据对象,实现产品信息共享.
图2 产品信息的检索与共享Fig.2 Retrieval and sharing of product information
Bayes网是1种由节点、有向弧组成的有向无环图 (Directed Acyclic Graph),它能够以图形化的形式明确地表达一定领域对象的相关性.这些关联对象的相关程度通过联合概率的形式进行描述,它量化了各对象间的相互依赖关系.图3是1个典型的Bayes网络图,其中节点Xn表示了随机变量,节点间的有向边表示变量之间的因果关系,节点间如果没有边相连则表示变量是条件独立的.对于Bayes网中任意节点xi,假设其直接双亲节点集为Pai,xi,的条件概率为P(xi|Pai).对于顶点集合X=(x1,x2,…,xn)的联合概率分布则由下式计算:
图3 Bayes网Fig.3 Bayesian network
Ribeiro-Neto和Muntz提出了经典的Bayes网信息检索模型[7],它通过构建由关键词组成的中间节点层将用户查询与相关文档进行模糊匹配.将上述思想与本体技术结合,本文构造出图4所示的扩展Bayes网模型.模型分为3层:本地PLM本体层,根节点层和协同企业目标PLM本体层.图中has-a为概念与属性的关系,由本地PLM本体元素构成,即os({es},{as},{rs}),这里{es}{as},{rs})分别为本地PLM本体中对象名称、对象属性和关联关系的集合.
根节点层由描述PLM数据对象名称及其属性的基本术语组成,这些术语构成基本词汇库.词汇库中的这些术语与制造企业的具体领域相关,并可根据实际情况进行相应扩展.术语根节点ui∈u⊂U={c1,…,cr,…,cm,d1,…,di,…,dn}(1≤i≤m+n)其中cr为对象名称术语,di为属性术语,u为U集合中元素所构成的任意可能子集.基本词汇库不但包括了对领域对象及属性描述的标准术语,而且包括在语义上与标准术语等价或相近的常用术语,从而能够扩大查询范围和有效地提高检索精度.对象间关联关系则由根节点间的语义信息表达,这些语义信息包括了对象元素与对象元素、对象元素与属性的关系(见图4中用虚线表达的关系),包括等同关系(equivalence)、泛化关系(generalize)、整体与部分关系(hasParts)、实例关系(instanceOf)、概念与属性的关系(has-a)等.根节点通过语义信息相互关联,反映出概念的结构化特征,从而方便不同的概念树(这里指对象元素与对象元素、对象与属性共同构成的关联结构)在整体结构上进行匹配,提高了检索的准确性.
目标PLM本体层由特定查询范围内的协同企业PLM本体元素组成,即Oj({ej},{aj},{rj})(j≥1),它们在构造上与本地PLM本体层类似,不再赘述.
图4 扩展的Bayes网检索模型Fig.4 Extended information retrieval model based on Bayesian network
目标对象的检索过程即是计算P(oj|os)概率值的过程.由Bayes模型可知,P(oj|os)的值反映了目标PLM本体元素在对象名称、对象属性和关联关系等方面与本地PLM本体元素的综合匹配程度.P(oj|os)的值越大,表示oj与目标本体元素近似程度越高,反之亦然.P(oj|os)值大于规定阈值的目标对象将被视为符合要求的检索目标.
由Bayes规则和全概率公式可知:
式中:α为归一化常数;条件概率P(oj|u),P(os|u)分别为给定的子集与本体元素oj|os的匹配程度,P(oj|u),P(os|u)值越大,则u与oj,os越匹配,反之亦然;P(u)为样本空间U 的各任意可能子集u 的概率.在这里,可根据语义关联信息确定可能子集u的数量t,并假设u等概率发生,则P(u)=1/t,t为整数且0<t≤2m+n.依据矢量空间模型计算P(oj|u)如下:
式中:wiu为术语ui在u中的权重,当ui∈u时,可取wiu=1,否则wiu=0;wij为术语ui在oj中的权重,对权重wij的不同计算方法将得到不同的匹配策略.P(os|u)的确定方法与P(oj|u)的计算类似,不再赘述.
在具体实现上,本文基于上节所述模型及算法开发了MPDICP(Middleware for Product Data Interoperation in Collaborative,PLMs)中间件核心模块,它遵循对象管理组织(Object Management Group,OMG)制定的产品数据管理软件规范,能方便地与协同企业PLM系统集成.下面以1个实例进一步说明本文所提方案的工作过程.
某锅炉企业的产品结构树片段如图5所示,锅炉产品主要由锅炉体和锅炉机组构成,其中核心的锅炉体部分由炉膛、锅筒、燃烧器、水冷壁过热器、省煤器、空气预热器等部件组成.该企业自己生产锅筒壳体.锅筒内部零件称之为锅筒内件,由协作企业提供.
过程1:将PLM数据对象本体化.在对PLM产品结构树进行本体化处理后,导入的锅炉本体片段如图6所示.
过程2:在基本词汇库的支持下,MPDICP模块查询协作企业PLM本体(见图7),寻找与“锅筒内件”相匹配的外协产品信息.计算相对概率P(oj|os),并将P(oj|os)大于阈值的对象列为检索目标.它们按概率值大小以降序排列分别为:“汽包附件”、“汽包”.依据领域知识可确定“锅筒内件”与“汽包附件”构成“等同类”的匹配关系.
图5 PLM锅炉对象Fig.5 Boiler PLM object
图6 锅炉本体片段Fig.6 Boiler ontology
图7 协作企业汽包附件本体Fig.7 Steam tank accessories ontology
过程3:根据确认的匹配关系,调整本地PLM数据对象信息.图8为调整后的PLM产品结构树,其中“锅筒内件”与“汽包附件”间建立了“等同类”语义匹配关系.
图8 信息集成后的PLM产品结构树Fig.8 Integrated PLM product structure tree
本文针对协同企业PLM产品信息检索中大量存在的语义差异问题,在PLM数据对象本体化的基础上,建立了扩展的Bayes网检索模型.案例表明,它无需构建复杂的语法规则,能在整体结构上对数据对象的名称、属性和关联关系进行自动检索和模糊匹配,为协同企业的产品信息集成与协作提供了1种准确性较好且高效的实现方案.
[1]李卫疆,赵铁军,王宪月.基于上下文的查询扩展[J].计算机研究与发展,2010,47(2):300-304.LI Weijiang,ZHAO Tiejun,WANG Xianyue.Context-sensitive query expansion[J].Journal of Computer Research and Development,2010,47(2):300-304.
[2]RAHM E,BERNSTEIN P A.A survey of approaches to automatic schema matching[J].The VLDB Journal,2001,10(4):334-350.
[3]CALADO P,RIBERIRO-NETO B,ZINIANI N,et al.Local versus global link information in the web[J].ACM Transactions on Information Systems,2003,21(1):42-63.
[4]SUDARSAN R,FENVES S J,SRIRAM R D,et al.A product information modeling framework for product lifecycle management[J].Computer Aided Design,2005,37(13):1399-1411.
[5]张金,涂俊翔,陈卓宁,等.基于自然语言语义的数据库目标检索研究[J].计算机系统应用,2009,18(2):57-60.ZHANG Jin,TU Junxiang,CHEN Zhuoning,et al.Research on database object retrieval based on natural language query[J].Computer Systems & Applications,2009,18(2):57-60.
[6]GRUBER T R.Towards principles for the design of ontologies used for knowledge sharing[J].International Journal of Human-computer Studies,1995,43(5-6):907-928.
[7]RIBERIRO-NETO B,MUNTZ R.A belief network model for IR[C]∥ The 19th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval 1996.New York:ACM Press,1996:253-260.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!