时间:2024-05-22
陶 锐,孙彦景,刘卫东
(中国矿业大学,江苏省煤矿电气与自动化工程实验室,江苏 徐州 210046)
深度学习的理论研究最早可以追溯至上个世纪四十年代,早期所提出的感知器模型只能处理线性分类问题,而无法做到正确分类非线性问题。为了使神经网络更好地适应非线性问题,Geoffry Hinton等人在1986年提出了BP误差反向传播算法,有效地解决了非线性分类和学习的问题。但由于这一时期,神经网络一直缺少相应的严格的数学理论支持,没有庞大数据量和强大计算能力的软硬件做后盾,没有引起足够的重视。随后,针对神经网络层数过深导致难以训练的问题,Hinton在2006年提出了无监督预训练和深度信念网络,通过无监督预训练对权值进行初始化及有监督训练微调这种贪婪的方式逐层添加和训练网络层,直到神经网络的层数足够深。使用这种策略,可以训练比以前更深的网络,也使得神经网络层数迈向更深的阶段,使深度学习得到了长足的发展。随着无监督预训练重新引起人们的兴趣,越来越多的研究人员又开始重新关注这项技术。深度神经网络开始超越传统方法,在越来越多的领域开始大展身手。此后,各大研究机构和公司纷纷投入到深度学习的研究与应用中[1-7]。
本文中,我们深入分析了电子票据容易被篡改的高风险案例,利用深度学习技术和卷积神经网络CNN(Convolutional Neural Networks)组成图像深度传感器网络,针对特定的票据内容区域进行重点加密。传统的水印加密方法不能有效地在鲁棒性和安全性之间做好平衡。因此,我们重点针对票据中的数字,金额和签名等字符区域,进行基于深度神经网络的检测定位,再结合水印技术进行多重的票据加密,使得篡改的检测更加高效。
图1 改进的CNN网络结构图
近年来,一些学者开始将卷积神经网络应用于包括计算机视觉、图像识别、自然语言处理等领域,已经产生了与人类专家相媲美并且在某些情况下更优越的结果[8-12]。一个典型的卷积神经网络由多个不同的层,以一定顺序前后级联构成,包括一个输入层,多个卷积层及池化层,一定数量的全连接层和最后一层输出层(损失层)[13-14]。卷积神经网络引入了一种特殊的组织隐层单元的方式——卷积,这使得网络可以很好地对输入数据的局部特征进行抽取。隐层之间局部连接的权重被称为卷积核(卷积滤波器),处于同一层的所有隐层单元共享同一卷积核,因此该层输出的结果即是该卷积核所抽取出的局部特征,也称为特征图[15]。
在卷积神经网络中,低层卷积层所抽取的特征,更接近原始输入数据,故而层次相对较低。而位于相对较顶层的高层卷积层,其抽取的特征源于低层卷积层抽取出的特征,故层次相对较高。卷积神经网络正是通过逐层抽取前一层网络的输出(特征图),完成抽取全局特征的工作。
传统的卷积神经网络采用串行堆叠结构,而这样的网络结构会导致网络最终提取出的特征中缺失低层次特征。针对这一问题,通过将网络中的所有卷积层的输出连接为一层,把网络中所有的特征图连接在一起,使得卷积网络最终提取出的特征包含来自各层的特征,从而最大程度上保留了特征信息,也可避免传统卷积网络中因为池化层的降维作用而损失一些边缘信息。
传统的深度卷积神经网络同样存在一些弊端,最常见的问题就是梯度消失、参数数量和体积较大、需要大量训练数据等。针对小数据集上的识别问题,由于领域不同,问题的解决方式同样不一,本文针对电子票据关键区域的识别问题,在数据较少的情况下,提出了一种特殊的网络结构方式,使得网络在有效学习数据的情况下不至于过拟合。实验证明了本文网络结构的有效性。
首先将网络中的所有卷积层的输出连接为一层,使得卷积网络最终提取出的特征包含来自各层的特征,从而最大程度上保留了特征信息。通过参考DeepID的网络连接方式,构建出适用于小样本的卷积神经网络结构。用Kl表示该网络第l层卷积层的卷积核,Il和Fl分别表示该层的输入和特征图。
(1)
然后按式(3)将特征图平展为一维特征:
(2)
式中:m,n表示第l层卷积核的尺寸。再将展平的各层特征图累加,得到最终的融合特征图:
(3)
本文网络结构如图1所示,第1个卷积层采用卷积核64@2×2,第2个卷积层采用卷积核96@2×2,第3个卷积层采用卷积核128@2×2,池化层均采用均值池化大小为2×2。网络训练参数设定如下:batch=16,epoch=100,学习率λ=0.000 01,使用随机梯度下降算法进行优化,交叉熵作为损失函数。本文对所有卷积层以及全连接层都施加了Dropout,卷积层采用Dropout比例为0.2,全连接层则为0.5。
在本节中,将提出一种利用可见水印和不可见水印的多重加密方法,能够达到对金融票据来源信息的标识和对篡改的定位检测。其结构如图2所示。
图2 基于可见水印和不可见水印的多重电子票据加密
传统的分块DCT变换计算公式如下:
(4)
(5)
如果考虑图像明暗对视觉容忍的影响,计算公式可进一步修正如下:
(6)
(7)
式中:DC是直流分量,max代表最大值,Xc0是分块直流系数。
嵌入可见水印图像的DCT系数变为:
(8)
水印叠加公式如下:
cij=αncij(n)+βnwij(n),n=1,2,…
(9)
式中:αn和βn是块n的拉伸系数,图像和水印的DCT系数分别是cij(n)和wij(n)。
(10)
(11)
算法1可见水印嵌入算法
输入:ArrayN×N水印图像矩阵,ImageN×N水印图像矩阵,x[0]迭代初始密钥
输出:Result嵌入水印的图像
1:y=WATERMARK(Array)
2:DCT变换获得文理信息
3:计算嵌入系数α,β
4:H=GENMATRIX(Image)
5:DCT图像分块ArrayNi×Ni
6:嵌入DCT系数
7:Result=y+H
本实验中,我们采集了1 200多张票据的数字图像,进行了水印的多重加密。我们在构造特征时,重点考虑针对灰度图像的特征构造,将普通的图像进行差分特征的分析,根据纵向以及横向的一阶和二阶差分特征,与原图图像构成5通道的图像输入特征。
实验采用深度学习框架Tensorflow进行搭建并训练网络,最终的网络超参数值见表1。
表1 训练超参数表
在图像信号中添加高斯白噪声,多种信噪比条件下,采用改进的CNN模型以及多种通道关键区域的识别结果如图3所示,其中,图3(a)、图3(c)、图3(e)、图3(g)以及图3(i)分别为20 dB、10 dB、0 dB、-10 dB和-20 dB时模型对应的识别率训练曲线,图3(b)、图3(d)、图3(f)、图3(h)以及图3(j)分别为20 dB、10 dB、0 dB、-10 dB和-20 dB时模型对应的损失函数训练曲线。图中的Epoch表示一个完整的票据数据训练集通过神经网络模型的次数。
图3 CNN模型在训练过程中的收敛曲线
在相同特征的基础上(五通道图),将本文网络与多种不同的分类器上进行了比较[16-19]。对比分类器及其参数如下:随机森林RF(Random Forest),森林中决策树个数为400,每棵决策树的最大深度为6,行采样率为0.75,列采样率为0.8;CNN共有两层卷积层,卷积核分别为和,还有两层具有5 000个神经元的全连接层以及Softmax层作为分类器,为了防止过拟合,卷积层与全连接层均采用了Dropout,比例为0.5;深度神经网络DNN(Deep Neural Networks),共5层全连接层,每层网络的神经元数目为384,同时每层均采用了Dropout,系数为0.5,最后一层为Softmax层。SVM,惩罚系数C=1,采用RBF核以及One VS One的多分类策略;K近邻算法KNN(K-Nearest Neighbor),近邻个数N=8,采用KD树进行搜索,并且树的度量距离为欧式距离;循环神经网络RNN(Recurrent Neural Networks),共有两层网络层,每层共1 024个神经元,每层的Dropout比例为0.5。
表2给出了7种分类器在理想无噪声环境下的实验结果。与随机森林、KNN以及SVM相比,本文模型识别率分别提升了9.8%、21.3%、14.5%,证明了在处理图像类多维特征时,卷积神经网络所表现出的性能优于SVM、KNN等传统分类器。
表2 多种分类器的识别率
水印图像的漏检测率和误检测率如表3和表4所示,其基于本文改进算法的图像检测效果明显优于传统的CNN算法。使用深度神经网络能够有效的定位关键区域,在保证安全性的同时,提高对图像水印检测的效率。图4中进一步可以看到在采用图像内容定位后对篡改区域的加密效率明显提高,计算时间得以显著降低。
图4 不同的图像尺寸下的计算时间
图像通道数改进CNN传统CNN单通道0.1020.133二通道0.0910.102三通道0.0610.089四通道0.0420.078五通道0.0320.045
表4 图像水印的误检测率
本文研究了针对票据关键区域的基于卷积神经网络的识别方法,对CNN网络结构进行了改进,提出了一种改进的适用票据内容定位的CNN网络。与传统CNN网络相比,本文提取出的多阶差分特征,与原图图像构成5通道图像特征,有效地挖掘了内在特征,并且结合卷积神经网络作为分类器,发挥了图像的多通道优势,使得输入数据包含更多的静态与动态特征,从而减少了加密处理的图像像素,提高了水印加密的计算效率。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!