当前位置:首页 期刊杂志

基于深度学习的拉削刀具磨损状态识别模型①

时间:2024-05-22

应申舜 傅晨泰 林绿胜 吕晓敏 张顺琦 易 凯③

(*浙江工业大学机械工程学院 杭州 310032)

(**浙江畅尔智能装备股份有限公司 缙云 321404)

(***上海大学机电工程与自动化学院 上海 200444)

0 引言

涡轮盘是航空发动机机械加工中最具有挑战性的零件,原因包括:(1)涡轮盘是整机安全的关键,质量标准较高;(2)部件材料是耐高温超级合金,如铬镍铁合金718、Rene 104 或者IN100PM,属于难加工材料。涡轮盘毛坯经过锻造、车削、磨削和钻孔成形,最后加工叶片安装槽,这些槽具有复杂的几何结构和较高的公差要求。制造槽的主要工艺技术就是拉削。若在加工过程中发生拉刀损伤(磨损、碎屑、刀齿破裂等),会刮伤工件导致额外的制造成本[1]。在加工过程中纳入监测和控制,即可保证加工质量,又能提高稳定性,因而世界各国都给予了高度重视。

涡轮盘榫槽拉刀最常见的失效方式是磨损失效。拉削刀具磨损状态识别方法包括直接法和间接法。直接法由数码显微镜、光学轮廓仪等测量工具直接测量刀具磨损状态,由于测量工具价格昂贵,并且需要在机床停机状态下进行,难以在工业环境下广泛应用[2]。间接法通过采集切削力[3-4]、电流[5]、振动[6-7]和声发射[8-9]等传感器信号,进一步提取和优化选择特征,并采用模糊理论[10-11]、支持向量机(support vector machine,SVM)[12-14]和隐马尔科夫模型[15-17]等方法建立刀具磨损状态与特征之间的映射关系模型,利用模型和实时采集的传感器信号,实现对刀具磨损的在线识别。间接方法具有方法多样、实时监测等优点,成为当前刀具状态监测的主要研究方向之一。孙志娟[15]结合皮尔逊相关分析法和近似冗余法实现特征筛选与降维,并提出以天牛粒子群优化算法解决混合隐马尔可夫模型寻优问题,实现刀具磨损的预测。Kong 等人[18]提出了基于高斯混合隐马尔可夫模型的刀具磨损估计模型,有效地识别铣床刀具的磨损状态。Schwenzer 等人[19]研究了支持向量机和随机森林(random forest,RF)两种立铣刀磨损状态分类方法,验证了所提出的方法在力和电流信号的分类结果对比,得出了SVM 能够从直切实验中获得更通用的模型。上述研究在刀具磨损状态识别方面选择机器学习相关模型,在某些领域取得不错的效果,但是机器学习模型依赖于前期特征提取、特征降维和特征融合等大量先验知识与反复测试,建模耗时耗力、效率不高且容易陷入局部最优。

随着智能制造的不断发展,深度学习在不使用先验知识和专家经验的情况下,利用优秀的自适应特征学习能力,在机器健康监测领域获得广泛关注,诸如稀疏自编码器、深度置信网络、卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)等深度学习算法在刀具状态监测应用领域取得了重要进展。Shi 等人[7]使用无监督学习将多个堆叠的稀疏自动编码器用于刀具状态监测中,解决了超精密加工离线监测效率低的问题。Nguyen 等人[20]基于堆叠式自动编码器和Softmax 构造深度学习网络(deep learning network,DLN),实现对刀具磨损状态有效识别。卢志远等人[21]提出了在线监测方法,并利用卷积神经网络建立了刀具磨损状态识别模型,该方法更加适用于生产加工现场。Cao 等人[22]提出了一种基于2-D 卷积神经网络和派生小波框架(derived wavelet frames,DWFs)的高鲁棒铣削刀具磨损监测方法,绕开了复杂且低便携性的特征工程。Cai 等人[23]使用堆叠的长短期记忆网络(long short-term memory,LSTM)提取多传感器时间序列中包含的抽象和深层特征,将提取的特征与过程信息结合,提高了刀具磨损状态识别的精度。文献[24-27]集成了深度卷积神经网络和长短期记忆网络的优点,通过提取时间序列中的数据依存关系,更加精准地识别刀具磨损状态。尽管基于深度学习的刀具磨损状态识别技术得到广泛关注,但是其自适应提取特征的能力还有待加强,需要进一步研究。此外,上述研究大多针对铣削加工,基于深度学习的拉削刀具磨损监测在理论和技术上尚处在验证阶段,高精度的拉削加工刀具状态识别技术有待深入研究。

本文采用振动信号为刀具磨损状态识别的信号源,将卷积神经网络和循环神经网络结合,提出了一种实现精确的拉削刀具状态识别的新方法。振动信号包含丰富的空间特征和前后时序特征,从特征提取的角度分析,卷积神经网络更适用于空间特征提取,而循环神经网络更适用于时间序列特征提取。本文借助稠密连接网络(densely connected network,DenseNet)网络和LSTM 网络构建特征提取方法,使得特征的输出在空间上和前后序列的输入都有联系,同时考虑到空间和时间问题。首先,研究了基于深度学习的特征提取理论基础,设计了DenseNet(3-2)网络结构和堆叠双向LSTM 网络。然后,引入密集层堆叠的全连接神经(fully connected neural network,FNN)网络,构建刀具磨损状态识别模型,并开展模型训练。接着,设计了涡轮盘榫槽拉削加工的刀具磨损状态识别实验,建立了基于混淆矩阵的性能指标体系,并开展实验研究。最后,通过与单个特征提取识别模型进行对比研究,结果表明该模型具有较好的识别速度和准确性。

1 深度学习理论基础

1.1 基于深度残差网络的空间特征提取

CNN 具有3 个关键特性,即权值共享、局部连接和输入输出数据的结构化。卷积神经网络强调几个相对的数据在相交和相离之间数据的上下层联系,数据的处理在时序上相互独立。卷积神经网络已在各种计算机视觉应用程序中取得了成功,这些应用程序的输入数据通常为二维数据。由于振动信号是一维数据,因此本文使用一维CNN。对于时间序列数据,卷积内核沿着时间轴移动以执行卷积操作。激活功能用于通过添加偏差来处理信息,以获得保留有用信息的特征图。池化层能够减少特征向量的长度,从而可以进一步减少模型参数的数量,被广泛应用于缩小特征向量。在处理时序序列时,CNN 中的一维卷积层首先在整个顺序输入多个卷积核,通过在序列上滑动卷积核来生成特征向量。然后,池化层从每个特征向量中提取最重要和固定长度的特征。图1 展示了一维CNN 的局部特征提取器框架。

图1 一维CNN 局部特征提取器

另外,卷积层和池化层都可以通过堆叠方式执行。通过堆叠的方式增加网络深度,提升识别准确率。但是随着网络深度的增加,一方面梯度消失的问题也愈加明显,梯度更新将会以指数形式衰减,导致部分参数不再更新。另一方面,模型过拟合,采样过多的噪声数据,使得准确率下降。深度残差网络刚好可以解决这些问题。DenseNet 提出了一个更激进的密集连接机制:即互相连接所有的层,每个层都会接受其前面所有层作为其额外的输入。通过对特征的极致利用达到更好的效果和更少的参数。

借鉴DenseNet 网络,设计DenseNet(3-2)网络结构作为刀具状态的自适应特征提取器。图2 给出了DenseNet(3-2)网络结构,它共包含2 个Dense-Block,各个DenseBlock 之间通过Transition 连接在一起。其中DenseBlock 是包含多个层的模块,每个层的特征图大小相同,层与层之间采用密集连接方式。而Transition 模块是连接2 个相邻的Dense-Block,并且通过Pooling 使特征图大小降低。

图2 DenseNet(3-2)网络结构

在DenseBlock 中,各个层之间的特征图大小一致,可以在channel 维度上连接。随着层数增加,DenseBlock 后面层的输入维度会非常大。因此,在DenseBlock 内部使用1 ×1 卷积层和批量归一化层(batch normalization,BN),如图3 所示。其中1 ×1卷积层用于降低通道维数和减少参数量,增加非线性和跨通道间的信息交互能力,从而提高了网络的表达能力。BN 用于解决网络更新过程中内部协变量偏移的问题。

图3 DenseBlock 密接层

1.2 基于长短期记忆网络的时间特征提取

循环神经网络对于数据处理侧重于序列的顺序,当前的数据可能对未来的数据发展产生影响,也可能与之前的数据有关联。常规的循环神经网络的主要目的是利用历史信息来辅助当前决策,但当循环体过长时,会出现梯度消失和梯度爆炸等问题。另一方面,RNN 决策主要还是依赖最后输入的一些信号,更早之前的信号会随着时间的推迟而强度变得越来越低,辅助作用变得越来越弱,网络无法学习和利用较久之前的信息。为了解决梯度消失、梯度爆炸和长期依赖的问题,通常使用长短时记忆网络。LSTM 不仅能够敏感地应对短期信息,而且能够对有价值的信息进行长期记忆,以提升网络的学习能力。

LSTM 具有RNN 相同的输入和输出,但是LSTM 引入了门控单元,用于控制信号的储存、利用和舍弃,如图4 所示。对于每个时刻t,LSTM 有输入门It、遗忘门Ft和输出门Ot共3 个门控单元[28]。

图4 LSTM 单元

遗忘门基于当前时间输入、前一时刻的输出和遗忘门的偏置项共同决定需要遗忘那一部分记忆。当前时刻第i个LSTM 单元的遗忘门的值可以用式(1)来表示。

其中,bF、UF和WF分别是LSTM 单元遗忘门的输入偏差、输入权重和循环权重,x(t)表示当前时刻的输入向量,j是输入向量的数量,h(t-1)是前一时刻的输出,σ 是Sigmoid 函数,它将遗忘门设置为0 到1之间的值。循环神经网络不仅需要遗忘门忘记部分之前的记忆,它还需要补充最新的记忆,可以通过输入门来控制。当前时刻第i个LSTM 单元的输入门的值可以用式(2)来表示。

其中,bI、UI和WI分别是LSTM 单元遗忘门的输入偏差、输入权重和循环权重。

LSTM 单元的内部状态将会以式(3)更新。

其中,b、U 和W 分别是LSTM 单元中的输入单元的输入偏差、输入权重和循环权重。当前时刻第i个LSTM 单元的输出门的值可以用式(4)来表示。

其中,bO、UO和WO分别是LSTM 单元输出门的输入偏差、输入权重和循环权重。LSTM 在得到当前时刻状态值S(t)i后会进一步产生当前时刻的输出。

基于上述门控单元,LSTM 能够学习到长期依赖性。利用LSTM 监测刀具状态,现有研究只考虑了正向依赖,而对倒序数据的反向依赖关注较少。对于预测问题中的依赖关系,序列数据进入LSTM 网络是按时间顺序排列的,结果LSTM 网络中的信息沿着链结构从时间步长t-1 传递到时间步长t,但有价值的信息可能被过滤掉。因此,获得反向依赖关系很有必要。双向LSTM 网络,既可以捕获正向依赖关系,也可以捕获反向依赖关系。双向LSTM 能够使用2 个单独的隐藏层在2 个方向处理序列数据,然后反馈到同一输出层。以下定义了相应的隐藏层函数,其中→和←分别表示前进和后退的过程,如式(6)所示。

堆叠多个LSTM 层形成一个深度LSTM 神经网络——堆叠的双向LSTM 网络(stacked Bi-directional long short term memory,SBiLSTM),可以让模型从输入数据中获取更深层次的特征。当涉及到深度LSTM 时,模型的输入可以通过多个LSTM 层传递,图5 所示为SBiLSTM 网络结构。一个LSTM 层的隐藏输出不仅随时间传播,而且还用于下一LSTM 层的输入数据。在双向LSTM 框架中,每个隐藏层都接收一个输入序列,该输入序列由下面一级的前向和后向层的输出序列组成。在终端时间步长的最后LSTM 层的输出被用作SBiLSTM 网络的输出。LSTM 层堆叠的优点是双重的,一个是堆叠层使模型能够学习不同时间尺度上原始信号的特性。另一个是参数可以分布在空间层上,而不是增加存储器大小,有助于输入原始信号实现更有效的非线性操作。

图5 SBiLSTM 网络结构

1.3 分类机制

卷积神经网络和循环神经网络可以视作特征提取器,在对刀具磨损状态识别时需要加入分类结构的全连接神经网络。对于多分类问题,输入、输出满足一个映射关系,信息从输入x的经过定义的映射关系,最终达到输出y。映射关系中间计算过程通过完全连接的密集层堆叠在一起,其中一层的输出用作下一层的输入。每层的计算公式为

其中,yi和xi分别表示第i个全连接层的输出和输入。和bi分别表示第i个完全连接层中的权重矩阵和偏置项。函数f()设置为ReLu 函数。最终,全连接神经网络最后一层将输出分类状态。

2 拉削刀具磨损状态识别模型

2.1 模型构建

DSBiLSTM 模型分为特征提取网络和分类网络。从特征提取的角度分析,一般认为DenseNet(3-2)网络适用于不同方向的振动信号空间特征提取,而SBiLSTM 网络更适用于同方向振动信号时间序列特征提取。DenseNet(3-2)网络强调几组独立数据在组别之间的上下层联系,数据处理在序列上相互独立。SBiLSTM 网络对于数据处理则侧重于序列顺序关系上,考虑当前数据对未来数据发展产生的影响和对前期数据的关联关系。DenseNet(3-2)网络和SBiLSTM 网络可以视作特征提取器,在对拉刀磨损状态识别时需要加入分类结构的全连接神经网络。

本文基于DenseNet(3-2)、SBiLSTM 和FNN 网络建立了端到端的刀具磨损状态识别模型,如图6所示,使得一个特征的输出在空间上和前后序列上都有联系,同时考虑到数据空间和时间关联关系,实现自适应特征提取,并对拉刀磨损状态精准识别。

图6 刀具状态识别模型

表1 给出了所建模型的每层详细信息。首先对输入序列数据进行预处理归一化操作,接着通过DenseNet(3-2)网络提取空间特征,空间特征提取之后保持较小的大小输出。然后,SBiLSTM 网络提取时间序列信息,以弥补DenseNet(3-2)网络在时序上特征提取的不足。此外,每个BILSTM 网络的前向层和后向层共享相同数量的隐藏单元。在SBiLSTM输出之后,将最后一个SBiLSTM 隐藏单元使用FNN网络添加非线性输出。最后,将学习到的高级表示形式接入线性分类层(softmax)以估计刀具磨损状态。此外,模型中使用Dropout 层以避免过度拟合和引入ReLU 函数标准化输出。

表1 刀具状态识别模型详细信息

(续表1)

2.2 模型训练

振动信号从加工现场收集,考虑到不同的加速度传感器数值上的差异,对数据进行归一化处理,以降低计算复杂度。原始数据根据式(8)进行归一化。

其中,xmax表示信号中的最大值。

对于做统一变换的监测信号,不会影响信号对刀具磨损状态的表征能力,归一化前后的信号如图7所示。

图7 数据预处理

在模型训练过程中,交叉熵损失误差被用作模型的损失函数,定义为

其中,N表示样本的数量,M表示类别的数量,yij指示变量(如果该类别和样本i的类别相同就是1,否则就是0),pij为观测样本i于类别j的预测概率。

将数据经归一化后,随机选取带磨损状态标注的振动信号样本的80%为训练集训练模型,剩余20%用作测试集评估训练优化后的模型,模型的训练和测试过程如图8 所示。利用训练集对刀具磨损状态模型进行训练,将训练集样本预处理和归一化后送入DSBiLSTM 用于刀具磨损状态分类,计算实际类别与预测类的交叉熵误差。模型采用Adam(adaptive moment estimation)优化算法更新网络的超参数,使得交叉熵损失函数的值不断下降,让模型预测值更趋于真实值。若损失函数未呈现逐渐减小趋势,则模型存在过拟合,调整模型结构进行训练。反之,模型收敛,调整模型参数直到具有较高的精度,保存模型结构和参数用于实际加工过程。将测试集作为训练有素的DSBiLSTM 模型的输入,通过正向传播得到刀具磨损状态,评估DSBiLSTM 模型的训练效果。

图8 刀具磨损状态识别流程图

3 实验验证及结果分析

3.1 实验装置和流程

实验研究在高速卧式榫槽拉床(型号:LG6516zx-2800)上进行,拉削刀具采用涂层硬质合金,拉削工件为某型号飞机涡轮盘,材料为高温镍基粉末合金FH97。拉削过程中采用14 个加速度传感器(型号:PCB333B30,量程:±50 g,灵敏度:((±10%)100 mV/g),按照x、y、z3 个方向粘附在拉床刀盒上(见图9),用于实时采集拉刀在加工过程中的振动信号。采用SCADAS III-305 采集卡处理实时信号并传送到Dell/M90 计算机上,信号的采样频率为2.56 kHz。实验训练深度学习的硬件平台采用高性能服务器,InterCore i7-9700 CPU,主频3.00 GHz,16 GB内存,GPU 选择NVIDIAGeForce RTX2070 SUPER 图像处理器。软件平台使用Ubuntu 16.04 操作系统,深度学习框架选用pytorch。

图9 刀具磨损实验装置图

实验采用8 把拉削刀具完成拉削操作,总共得到790 个原始样本信号。拉削刀具加工工件一次记为一个拉削行程,每个拉削行程结束后,将拉削刀具取下放到显微镜下,测量并记录最易磨损的刀齿后刀面的1/2 处得刀具平均磨损量。

根据刀具磨损过程并结合实验情况,在后刀面磨损量为0~0.05 mm 时,拉削刀具在较短的时间内迅速磨损,将该阶段划分为初期磨损阶段;在后刀面磨损量为0.05~0.2 mm 时,拉削刀具切削过程平稳,工件表面质量较好,将该阶段划分为中期磨损阶段;在后刀面磨损量大于0.2 mm 时,刀具磨损量迅速增加,工件加工表面粗糙,刀具在较短的时间内迅速达到失效状态,需要及时换刀或刃磨,将该阶段划分为磨钝阶段。将刀具磨损状态划分为3 种数据标签,并采用one-hot 编码形式对刀具磨损状态进行编码。

3.2 实验结果与分析

实验将训练集样本送入DenseNet(3-2)网络和SBiLSTM 网络自适应提取空间和时间上的特征,特征提取后使用FNN 网络用于刀具磨损状态分类,计算实际类别与预测类的交叉熵误差,采用Adam 优化算法更新网络的权重参数,使得交叉熵损失函数的值不断下降,让模型预测值更趋于真实值,并保存训练结果。同时,为了能更好地阐述量化特征提取方法在刀具状态识别中的优越性,将DenseNet(3-2)分类模型和SBiLSTM 分类模型与DSBiLSTM 模型进行对比,训练过程中3 个模型设置相同的参数,模型的具体参数表如表2 所示。

表2 模型具体参数表

经过训练后,得到不同的准确率和损失函数值,3 个模型的准确率和损失函数变化曲线如图10 所示。由图10 可知,随着迭代次数(epoch)的增加,各个模型的交叉熵损失函数总体呈现下降趋势,准确率逐渐升高,没有出现梯度爆炸或梯度弥散现象,最终模型都以较快速度收敛。

图10 各模型准确率和损失函数变化曲线

测试样本总量为158 个,其中初期磨损样本为39 个、中期磨损样本为100 个、磨钝样本为19 个,将模型训练收敛后保存的DenseNet(3-2)分类模型、SBiLSTM 分类模型和DSBiLSM 模型的结构和权重参数,放入测试集中进行测试。通过混淆矩阵展示测试结果如图11 所示。

图11 模型测试结果混淆矩阵图

由图11(a)和图11(b)识别结果可以得出,只关注空间特征信息的DenseNet(3-2)模型准确率为95.56%;只关注时序特征信息的SBiLSTM 模型准确率为84.81%,虽然DenseNet(3-2)模型准确率比较高,但在对刀具初期磨损状态识别中精确率和召回率分别为90.24%、94.87%,仍不能满足精度要求。由于初始振动信号没有经过降维处理,直接将标准化后的振动信号作为SBiLSTM 模型的输入,在完整序列中提取时序特征信息运算成本巨大,且SBiLSTM 模型未能学习到刀具磨损状态的空间特征映射,导致SBiLSTM 模型识别效果较差。以上DenseNet(3-2)模型和SBiLSTM 模型对拉削刀具磨损状态识别,其结果都不理想。

从图11(c)分析可以得出,DSBiLSTM 模型的准确率为98.73%,比DenseNet(3-2)模型准确率提升了2.17%;DSBiLSTM 模型中的SBiLSTM 网络的输入是经过DenseNet(3-2)网络特征提取降维后的特征向量(d=224),所以DSBiLSTM 模型相对SBiLSTM 模型提取时序特征的情况,参数计算量小,运算速度快;DSBiLSTM 模型在对磨钝状态识别中,精确率和召回率为100%、95%。

由表3 可知,DenseNet(3-2)和SBiLSTM 模型测试集的准确率分别为95.56%和84.81%,预测精度较低,表明单独的空间特征提取和时间特征提取可以对刀具磨损状态进行预测,但由于受模型自适应特征提取能力的限制,无法捕获刀具振动信号中更深层次隐藏的特征。DSBiLSTM 模型相较于DenseNet(3-2)和SBiLSTM 模型结构较深的情况下,单次识别时间分别快2 ms 和78 ms。DSBiLSTM 模型利用DenseNet(3-2)模型特征重用优势有效地提取振动信号中的空间特征信息,并对振动信号进行降维,便于后续时序特征提取到振动信号时序特征的依赖关系,同时利用SBiLSTM 模型的优势,从正向和反向捕捉振动信号过去和未来的特征信息,挖掘出振动信号丰富的时间特征信息。最后,测试集的准确率达到98.73%。在性能方面,DSBiLSTM 模型的单次测试时间为11 ms,满足工业生产在线拉削刀具状态识别应用。因此,实验结果表明DSBiLSTM 模型具有较高的识别精度,更适合在线拉削刀具状态识别。

表3 测试集的单次测试时间和准确率

4 结论

本文提出了一种用于刀具磨损状态识别的改进的深度学习模型,该模型整合了DenseNet 网络和LSTM 网络的优势,由DenseNet(3-2)网络结构挖掘出振动信号与刀具磨损状态间的空间相关性特征,而SBiLSTM 网络能够补充与刀具磨损状态间的时序相关性特征。此外,所设计实验装置可以有效地采集拉削刀具在操作过程中输出的振动信号和测量拉削刀具的磨损量,具有简单实用的特点。对比实验研究发现,DSBiLSTM 模型兼顾DenseNet(3-2)模型和SBiLSTM 模型的特性,具有较深的模型结构,且比DenseNet(3-2)模型和SBiLSTM 模型有较高的准确率和较快的运算速度,适用于涡轮盘榫槽拉削刀具在线磨损状态识别。

深度学习是数据驱动的方法,需要大量数据进行模型训练,且刀具状态识别模型随着拉削系统参数的变化也需要进行动态调整。后续研究将进一步增加传感型号的类型和数量,以获取更多的运行数据,实现对刀具磨损状态提取更加全面的状态特征,并动态更新模型参数,从而达到更准确的识别效果。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!