时间:2024-05-04
谷潇 冯小洁 李磊 青岛滨海学院
关键字:数据挖掘 离散制造业 质量评估 知识发现
数据挖掘作为一种新兴的多学科交叉应用技术已经应用于各个行业中,我国作为世界上第一制造大国,同样也离不开大数据的支持和发展。解决企业生产的一个关键问题就是制造商如何更快的提高产品质量和产量,所以质量评估对一个制造企业来说尤为重要,这关乎于企业的安全、利润和信誉,因此这需要更方便、更系统的方法来解决。目前许多企业已经构建了集成的数据库来存储来自生产部门的各种操作数据,存储涉及到多个输入和输出变量,这些变量不易建模和优化,因此,数据挖掘和数据库知识发现(KDD)已经成功应用于解决质量评估和控制问题,比如如何分类产品的质量,找出参数,以及如何进行优化获得最佳输出等,利用数据挖掘实现对产品的质量评估也逐渐成为未来的发展趋势。第一节描述了进行质量评估时几个重要的质量任务,第二节对数据库知识发现和数据挖掘进行简单的分析和总结,第三节概括数据挖掘在质量评估中的应用,最后提供结论以及对未来离散制造业的研究和发展方向。
对于目前国内大多数制造业来说,在生产制造过程中所产生的数据皆以电子的方式收集并存储在数据库中,而相对于离散制造业来说,离散制造业以多品种小批量订单生产方式生产,产品由许多零部件组成,各零部件的加工装配过程依次独立,不同或相同的零件都面对着不同的供应商,在进行各类批量生产加工的同时还面临着高质量产品的要求,这给企业的数据收集和质量评估带来一定的难度。为了保证产品和服务的有效性、提高客户满意度和期望值、降低开发成本、减少流动时间、增强投资者的信心,质量评估应该被考虑到离散制造业的各个生产环节中去,在生产进度中控制好零部件的完整性和质量保证。质量评估方法从六西格玛(6sigma)到改进的六西格玛设计(DFSS),虽然传统的数据分析工具已经成功用于提高产品进程的质量,但主要研究的是在设计阶段或流程上的缺陷预防和监测问题,然而在生产制造阶段,仍处于人工检测状态,由熟练的操作人员根据他们的经验来加工,最终产品是送货到经销商供检查人员验货。随着制造流程数据越来越多,每隔几秒就会产生大量数据,包括设备的开机率、主轴的运转率、负载率、运行率、故障率、生产率、设备的总和利用率、零部件的合格率、质量百分比等,数据收集相对困难且分布不均匀,这需要更强大的工具来收集大量的数据集和挖掘出有效信息,因此数据挖掘和数据库知识发现逐渐应用于解决质量评估问题。
制造商首先要明确质量任务,根据Hamidey Rostami表述产品生产制造阶段的主要质量评估和控制活动,本文主要总结和改进为如下几个功能如图一所示:收集质量数据、质量分类,确定质量因子、质量建模(包括输入和输出质量因子)和质量预测。
质量任务需要解决以下几个方面的问题:
1.质量数据:获取全面的数据是进行数据挖掘的必要前提,制造商从生产线的各个阶段获得涉及到质量问题的所有数据。
2.质量分类:利用分类方法对质量样本学习进行数据分类,该功通过一系列活动建立分类器。
3.质量因子:找出影响产品质量的变量,根据其重要性对质量因子和变量进行排序。
4.质量建模:利用有限的数据进行模型开发,确立输入和输出参数。
5.质量预测:主要是进行缺陷预防和监测,对输出的产品质量进行可视化操作,从而得出预测结果。
Padhy 和Mishra 指出数据挖掘通常称为数据库中的知识发现(KDD),从数据库中提取隐含、未知或可能有用的信息。Mümine KAYA KELES 提出数据挖掘从原始数据中进行提取和分析从而发现关联有趣和有用信息的过程。数据挖掘作为知识发现进程的一部分,主要过程如图二所示。第一部分是进行数据的预处理,包括数据清洗、数据集成、数据选择等,在此过程中因为数据的复杂性和多样性,需要进行噪声处理,删除错误和不一致数据。第二部分数据挖掘,以特定的一组代表形式来建立感兴趣的模式,这包括:分类、聚类、回归、汇总、偏差检测、依赖性建模和预测。其中分类方法常用的有SVM 算法、KNN 算法、朴素贝叶斯算法、决策树等。预测方法常用的有神经网络、Markov 模型、Bayesian 估计和ELM 等,同时建立可提取的模式或给定提取的模型数据进行可视化,目前已有利用EOS-ELM 方法解决工业大数据的状态预测问题。第三部分将这些信息汇总转化为有价值的知识。
图二 KDD 过程步骤概述
以某一小型加工配件厂为例,制造商从生产线的各个阶段获得涉及到质量问题的所有几何数据,包括来自原材料数据、生产机器的传感器数据、历史日志、机床自动化数据、现场检测纪录数据以及设备、人员、环境等间接影响质量的数据,或者也包括过程模拟数据集,对已经收集的历史数据进行数据预处理,将企业的产品加工数据存储在不同的数据服务器上。其次根据产品本身的特性对研究个体进行分类,从中发现规律和典型模式。企业中的诸多产品,比如轴套、筒盖、万向轮、螺丝、钢板等等可根据图纸规格型号或产品材质对不同产品进行分类,而具有相同特征的产品划分为一组事物,这也是所谓的聚类,从而找到最可能的区分低质量和高质量产品的质量因素。
在传统的管理模式下,一方面,我国目前很多离散制造企业仍然局限于质监部门的独立活动,难以实现对产品整体进货和销售水平的控制;另一方面,企业收集到的大量的、杂乱的数据没有得到充分利用,现阶段大部分中小企业还停留在用Excel 对加工数据的简单统计和图标显示,更极少数的企业能够将数据进行可视化展现。而国外的发展相对迅速,从产品的生产质量、质量预测、质量分类到参数优化几个方面都提出了新的想法并进行了实际应用。自组织神经网络的组合和规则归纳(SOMs)已经被用于从正常收集的晶圆制造数据中识别关键的低产量因子(Gardner&Bieker,2000);Andrew Kusiak,Member使用数据挖掘方法用于从数据集中提取知识用于预测和预防晶圆制造故障;Chong,Albin 和Jun(2007)使用基于规则归纳法(PRIM)来确定炼钢过程中过程变量的最佳设置;Cleon Davis 等人实现了反向传播神经网络(BPNN)算法去构建、训练和锻炼用于各种半导体的多层感知器神经网络。
本文对于数据挖掘应用于离散制造业中的质量评估的相关理论和所用技术进行了阐述,由于制造业的客户和技术要求不断变化以及生产过程的复杂性,数据挖掘工具的应用能够为企业提高效益和效率。利用数据库知识发现(KDD)改进和监测整个制造过程从而确保生产安全性。更近一步来说,如何进一步利用支持向量机(SVM)等分类器进行特征及分解,如何用最优算法进行预测生成准确决策,如何对生产环节的低质量产品进行自动识别等,都将是未来我们研究的方向。
对对照组的25例患者施以常规护理,在患者入院以后,护理人员要遵医嘱按时按量指导患者服用药物,了解和观察患者的病情恢复状况,实施常规健康宣教,对患者的日常生活进行常规干预,让患者养成良好的生活作息习惯。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!