当前位置:首页 期刊杂志

基于Anaconda平台的专项技术数据分析系统在生产线中的应用

时间:2024-08-31

李光宙

摘  要:目前,某大型汽车制造企业的生产线相关设备并未按照其所属的专项技术对数据进行分类分析,存在数据资源浪费的问题。该企业动力总成区域生产线设备众多,所使用的尖端专项技术种类繁杂。基于专项技术的角度,对日常数据资源进行筛选与分析,从而更有针对性地做好生产线维护工作。该研究使用Python这一跨平台、面向对象编程的计算机程序设计语言,基于Anaconda这一开源的数据处理平台进行数据处理。将原始数据导入Pandas数据包中的DataFrame框架之中,进行数据清洗工作。该研究所述数据挖掘工作以A轴技术的“报警信息”及“报警号”为关键字段,使用网络爬虫技术获取专项技术数据,以专项技术数据获取停机时间和设备可用率这两个生产线关键指标,并进行相应的数学计算。并对关键指标作数据可视化处理,将其以可视化报表的形式呈现。本文以该大型汽车制造企业动力总成区域的某条生产线为例,介绍专项技术数据分析在生产线设备中的应用。

关键词:数据分析  编程  专项技术  生产线  应用

中图分类号:TB497                           文献标识码:A文章编号:1674-098X(2021)04(b)-0131-07

Application of Specialized Technical Data Analysis System Based on Anaconda Platform in Production Line

LI Guangzhou

(Planning & Technology, Beijing Benz Automotive Co., Ltd., Beijing, 100176 China)

Abstract: At present, the production line related equipment of a large automobile manufacturing enterprise does not classify and analyze the data according to its special technology, which leads to the waste of data resources. There are a lot of equipment in the power assembly area of the enterprise, and the kinds of advanced special technologies used are complex. Based on the perspective of special technology, daily data resources are screened and analyzed, so as to do a better job of production line maintenance. This research uses python, a cross platform, object-oriented programming language, to process data based on anaconda, an open source data processing platform. The original data is imported into the DataFrame framework of pandas data package for data cleaning. The data mining work described in this study takes the "alarm information" and "alarm number" of a-axis technology as the key fields, uses the web crawler technology to obtain the special technical data, and uses the special technical data to obtain the downtime and equipment availability, two key indicators of the production line, and carries out the corresponding mathematical calculation. The key indicators are visualized and presented in the form of visual report. This paper introduces the application of special technical data analysis in the production line equipment by taking a production line in the powertrain area of the large automobile manufacturing enterprise as an example.

Key Words: Data analysis; Coding; Specialized technology; Production line; Application

隨着智能制造、制造物联网技术的发展,制造企业可以从加工设备中采集和获取制造过程中产生的具有典型大数据特征的海量数据[1]。数控加工设备、底层传感器、PLC等每时每刻可以采集大量的数据,由此形成数控车间制造大数据[2]。这些海量的数据为后续的数据分析工作提供了数据基础。制造大数据不仅具有传统大数据的4V特征,即Volume(数据量大)、Variety(数据类型多样)、Value(数据价值比较大但是有价值的信息密度比较低)、Velocity(数据时效性高)特征,还具有数据间的强关联性,具有对数据采集、存储、处理实时性要求高等特征[3]。

数据分析是用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程[4]。

生产线上不断提高的产量会给生产线管理带来诸多问题[5],生产线数据处理就是其中之一。在日常生产中,某大型汽车制造企业的生产设备产生了海量的生产数据,其中包含众多故障报警信息,但目前这些数据信息并未按照其所属的专项技术进行分类分析,从而造成了对现有数据资源的巨大浪费。

对于类似问题,周寻[6]认为应该对设备综合效率进行发掘和优化,并主要通过精益生产理论以及约束理论等方法研究提高生产线的资源优化方案,分析出可能改进的机会和方法和方案。孙伟峰[7]认为通过对机械部件所产生的信号进行处理和分析,可以有效判断出故障状况,从而提高故障检测的效率,并强调了对数据进行科学的管理的重要性。Panagiotis Tsarouhas[8]做了数据趋势与序列相关性测试,他认为应该使用统计学方法分析生产线的故障数据并计算出生产线的可靠性有效性与可维护性,从而提升生产线性能。Naser Habibifar等人[9]使用仿真模拟以及数据环境分析的方法研究药品生产线的优化问题,为此他们仿真出药品生产线并搭建数据分析环境来验证自己的设想。

本文的研究从某大型汽车制造企业入手,该企业动力总成区域坐拥诸多种尖端专项技术,例如,电主轴技术、A轴技术、机器人技术、珩磨技术、试漏技术、压装技术、测量技术、激光打码技术等。技术种类繁杂,涉及到的生产线及设备种类及数量众多。

基于專项技术的角度,运用数据科学的相关方法对日常海量的数据资源进行筛选与分析,可以及时调整生产设备的维护计划并对设备问题进行提前预测,从而最大限度地减少停机次数与时长,更有针对性地做好生产线维护工作。

1  专项技术数据分析

Anaconda是一个开源的数据处理平台,易于使用并且具有强大的数据处理能力。Python是一种跨平台、面向对象编程的计算机程序设计语言,它包含多个数据处理包,如Numpy、Pandas、Scipy、Matplotlib、Scikit-learn等。Pandas是Python的一个数据分析库,它含有诸如DataFrame、Series等数据结构模块。python具有很强的可移植性,由于其开源的本质,已经被移植在许多平台上,按照开源的理论,Python几乎适应各种平台;Python是解释执行的,即Python语言写的程序可以直接从源代码运行,无需先通过编译生成可执行文件[10]。本文使用Python编程语言,基于Anaconda平台进行数据处理。

1.1 数据采集

数据采集是指将传感器安装在待测设备合适的位置或配置在设备的周围,进而将待测设备的运行情况、工作环境等信息映射成相应的光、电、磁等信号,通过信号放大器与相匹配的数据采集系统将信号传输至上位机进行存储、显示或打印的过程[11]。某大型汽车制造企业使用相关软硬件系统采集所有生产线设备的实时数据。

设备相关数据信息由设备上的硬件传感器以及工厂工 业网络统一传递到该系统采集数据。

1.2 数据清洗

数据清洗是一种提高数据质量的可行有效的技术方法,它主要用于处理在数据质量问题中,出现在实例层的脏数据,从而充分提高数据的质量[12]。

某大型汽车制造企业动力总成区域的设备每天会产生海量的数据。需要使用大数据技术对这些数量巨大的数据进行处理,筛选出所需的有效数据,从而对有效数据进行分析与处理。使用Pandas数据包中的DataFrame框架,DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,DataFrame的行索引是index,列索引是column。将原始数据导入该数据处理框架中处理原始数据,进行数据清洗工作。

为上述数据集合建立起对应的DataFrame框架,将杂乱无章的原始数据统一地转换为DataFrame数据类型。选取并设置相应的column name,使用DataFrame框架去直接获取该框架column中所一一对应的value,该返回值为Series数据类型,对该返回值进行过滤处理,其中,Series可以理解为由一列索引和一列值组成的结构,而DataFrame就是由一列索引和多列值组成的结构,DataFrame中的每一列都是一个Series对象。

使用isnull()、dropna()等编程指令筛选出原始数据中的NaN值,再使用fillna()编程指令修补数据。其中,isnull ()指令可以判断所有的空值,dropna()指令可以删除缺失数据所在的行,NaN值是Python指令在做计算时无法返回的一个符号,NaN值需要被处理,fillna()指令用于填补缺失值。

另外,如图1,需要使用判断编程指令找出异常值并进行处理,从而保证数据的连贯性。使用index编程指令对初筛过的数据重新设定数据索引目录(index项),使得筛选出的每个有效数据都对应有其专属的索引目录(index项)。编制好新的索引目录(index项)的相关数据就组成了一个全新的DataFrame框架,该框架中的数据全部是完成数据清洗后的有效数据。

1.3 数据挖掘:获取专项技术数据

数据挖掘是从大型数据库中抽取出未知的、有意义的关系、趋势和模式的过程,是数据库研究中具有重要价值的研究领域,其广泛应用在金融、医疗、电信、人工智能等领域[13]。

A轴单元作为五轴数控机床的关键功能部件,其控制精度直接影响工件的加工精度和表面质量[14]。A轴技术作为设备关键技术,被广泛地使用于汽车发动机生产线设备之中。A轴伴有大量相关故障报警信息。 其“报警信息”文本及“报警号”数字信息是数据处理的关键信息,使用网络爬虫原理识别“报警信息”关键字段并抓取“报警号”。将获取到的Series数据类型装载到相应的DataFrame框架中得到专项技术数据,如图2。

1.4 基于專项技术的生产线关键指标计算

某大型汽车制造企业生产线的核心指标是设备综合效率,该指标反映的是每日/月生产线除设备故障外正常运行的时间占比。从设备技术角度考虑,影响设备综合效率的关键指标是停机时间(DT)和设备可用率(TA, Technology availability),如图3、图4。

基于该理念,以上述专项技术数据获取生产线核心指标。使用计算机底层时间,来统一数据处理的时间设置,即为使用统一的时间度量衡。使用数学公式计算出基于专项技术的生产线关键指标:停机时间(DT)和设备可用率(TA)。相关指标的数学计算需要用到以下这些参数:生产线设备生产时间,PTi=PT;生产线设备总数,DN;DT单元(单个计量单元的DT数值),DTi。

单个计量单元的设备可用率计算:

(1)

停机时间(DT)的计算:

(2)

设备可用率(TA)的计算:

(3)

1.5 专项技术数据可视化

数据可视化是关于数据视觉表现形式的科学和技术研究,实现可视化是为了证实我们对数据的认识[15]。数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧[16]。

对基于专项技术的设备关键指标做数据可视化处理,将其以可视化报表的形式呈现出来。打印出该可视化报表的打印时间、某区域某专项技术的设备关键指标:停机时间(DT)和设备可用率(TA)。下面以某大型汽车制造企业动力总成区域的某条生产线为例,以A轴技术(A Axis)作为切入点,展示基于专项技术的设备关键指标可视化报表,如图5。

2  专项技术数据分析在生产线设备中的应用

做好生产线设备的维护保养工作,可有效延长生产线的使用寿命并有效提高设备的使用率和完好率[17]。下面以某大型汽车制造企业动力总成区域的某条生产线为例,介绍该专项技术数据分析在独立的生产线维护体系中的应用。该区域与其他区域生产线在设备投产时间、设备备件型号、所生产的产品型号、设备数量与所应用的专项技术种类等诸多方面存在着较大的不同。针对设备的老化、维护保养以及所使用的专项技术等问题,需要使用不同的维护策略。依托专项技术数据分析系统所生成的专项技术相关关键指标,有针对性地制定出基于专项技术的生产线维护体系,如图6。

2.1 某区域生产线维护体系总揽

依托专项技术数据分析系统,为某大型汽车制造企业动力总成区域某生产线的所有设备建立起独立的生产线维护体系。

在实际工作中,为了更加有针对性地保障生产线的正常运转,需要提前做好预防性维护工作,做好计划并组织好工作内容。在某大型汽车制造企业动力总成区域某生产线维护体系的建立过程中,为每一台设备添加了诸如“任务清单描述”“维护策略”“工序描述”“时间间隔组”“系统条件”“工序号”“总工时”“工时单位”“参与人数”“每人工作持续时间”“数量”等条目。生产线维护工作是复杂繁重的,而以上的这些条目则正好有力地分解了维护工作,将繁杂的工作划分到具体的条目之中,从而使得实际维护工作进行得更为细致与准确。

2.2 某区域生产线维护条目

对于生产线日常运营而言,一个主要的目标就是要最大化地减小成本,要同时减少生产和维护成本[18]。制定出合理的维护条目会较好地减少成本支出。

该维护体系中的每个维护条目是种类繁多并且在技术难度和人员要求等方面都存在着诸多的不同之处。为了使维护工作顺利展开与有效实施,该体系中的不同条目一般使用不同的时间间隔组。时间间隔组的组成为1~60个月,不同的维护条目一般使用不同的时间间隔组来完成,如图7。

3 结语

我们处在一个大数据技术与计算机编程技术日趋完善的时代,我们也正站在物联网时代的门口。而这些技术在制造业的实现是需要有硬件、软件接口的。而本文所述的专项技术数据分析系统及相应的生产线维护体系则正好起到了这样的一个接口功能。

基于专项技术的设备关键指标可视化报表会显示每天该生产线所拥专项技术所存在的问题,会将所有信息数据积累到一起,从而为每项专项技术形成专项故障信息数据库。这就为数据分析工作提供了有效的数据样本,在数据量积累到一定规模之后,即可使用机器学习的方法,将该数据样本分为训练集、验证集和测试集,从而建立更为有效的数据模型用以生产线设备的可能专项技术故障作预测。

参考文献

[1] 王孟卓.基于大数据分析的数控加工工时预测技术研究[D].北京:中国工程物理研究院,2020.

[2] 王孟卓,尚鋆,白翱.面向数控加工工时预测的智能车间制造大数据分析技术体系研究[J].现代制造技术与装备,2020(4):33-37.

[3] 李敏波,王海鹏,陈松奎.工业大数据分析技术与轮胎销售数据预测[J].计算机工程与应用,2017(11):100-109.

[4] 维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.

[5] Samihah Abdullah, Widad Ismail, Zaini Abdul Halim. Implementation of Wireless RFID for Production Line Management System in a Real Environment[J].Wireless Personal Communications,2015:3119–3132.

[6] 周寻.关于提高C公司喷漆生产线设备综合效率(OEE)的研究[D].苏州:苏州大学,2016.

[7] 孙伟峰.滚动轴承振动信号分析与数据处理系统设计与实现[D].哈尔滨:哈尔滨工 业大學,2020.

[8] Panagiotis Tsarouhas. Statistical analysis of failure data for estimating reliability, availability and maintainability of an automated croissant production line[J].Journal of Quality in Maintenance Engineering, 2019(25):452-475.

[9] Naser Habibifar, Mahdi Hamid, Mahdi Bastan, Ahmad Taher Azar. Performance optimisation of a pharmaceutical production line by integrated simulation and data envelopment analysis[J]. International Journal of Simulation and Process Modelling, 2019(14).

[10] 嵩天,黄天羽,礼欣.程序设计基础:PYTHON语言[M].北京:高等教育出版社,2014.

[11] PECHT M G,KANG M. Prognostics and Health Management of Electronics:Fundamentals,Machine Learning,and the Internet of Things[M]. New Jersey: John Wiley & Sons, 2018.

[12] 廖书妍.数据清洗研究综述[J].电脑知识与技术,2020(20):44-47.

[13] 朱宏列,戚欣.数据挖掘在智慧城市中的应用[J].计算机时代,2020(10):40-42.

[14] 赵鹏兵,史耀耀.高效强力复合铣A轴的动力学建模与自适应滑模控制[J].航空学报,2014(2):555-566.

[15] 左圆圆,王媛媛,蒋珊珊,等.数据可视化分析综述[J].科技与创新,2019(11):82-83.

[16] 任磊,杜一,马帅,张小龙,等.大数据可视分析综述[J].软件学报,2014(9):1909-1936.

[17] 刘志强,郝力辉,陈立维,等.进口汽车发动机生产线的维护与管理[J].设备管理与维修,2016(1):11-13.

[18] Ait El Cadi Abdessamad, Gharbi Ali, Dhouib Karem, et al. Joint production and preventive maintenance controls for unreliable and imperfect manufacturing systems[J]. Journal of Manufacturing Systems,2021:263-279.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!