时间:2024-05-28
吕晨曦 杨冬风
(黑龙江八一农垦大学电气与信息工程学院,黑龙江 大庆 163311)
玉米种子是当今我国农业生产中不可或缺的生产资料。不同品种的玉米在抗倒伏、抗病虫害、产量、营养成分等方面存在明显差异。传统的玉米种子识别方法有以识别种子形态、幼苗形态和植株形态为主的形态学方法,以电泳法测定化学成分为主的生理生化鉴定法,依靠种子分子水平DNA和RNA等之间差异实现品种鉴别的分子生物学鉴定法。但随着市场中玉米品种的不断增加,为了保证玉米种子的纯度,避免种子掺假现象的出现,研究人员正研究一种可以准确无损地识别玉米品种的新方法。相对于传统人工识别,机器视觉识别具有省时、省力、识别准确率高等优点。利用机器视觉对玉米种子进行识别,可以脱离人工识别的束缚,为不同品种玉米种子的识别提供新的可行方法。
目前,我国对常规种子的品种检验方法主要有田间种植鉴定、色谱分析技术、利用卡尺和天平等手动测量。汪勇利用人工神经网络法对5个玉米品种共250粒种子的品种进行了识别,准确率高达92.4%。冯朝丽等结合偏最小二乘判别分析法对所选玉米种子样本进行识别分类,样本的识别精度也达到了94.66%。李奔等对玉米种子图像的颜色特征进行了研究,提出了新的颜色指标,即RGB和HSV颜色模型中各个分量所占的比例以及单位面积的占比,运用神经网络进行训练,得到很好的分类识别效果,3个品种总的识别率为93.3%。上述试验基本采用特征提取对数据进行处理,忽略了特征值过多带来的冗余性,由此导致识别的准确率下降。对特征数据进行数据降维可以提高品种识别的准确率,缩短识别处理时间。
为了降低特征数据的冗余性,提高品种识别的效率,笔者在试验中采用了主成分分析(PCA)对提取后的特征数据进行特征降维。针对玉米种子品种识别效率低的问题,利用支持向量机(SVM)对玉米种子进行分类识别。针对机器视觉技术需要训练的特征数据不足的问题,对玉米种子进行颜色、几何及纹理等特征提取,从而达到提高识别准确率的目的。此次试验将主成分分析(PCA)、线性判别分析(LDA)、等距特征映射(ISOMAP)、T分布随机近邻嵌入(T-SNE)、多维尺度变换算法(MDS)5种降维方法与2种分类器贝叶斯(Bayes)与支持向量机(SVM)分别结合,通过对比测试集准确率得知,PCA-SVM模型在对玉米种子品种识别方面有较高的准确率,为玉米种子的品种识别提供了新方法。
试验材料包括3个玉米品种(甜糯黄玉米、甜妃、昌甜)成熟且饱满的种子各50粒,手机原相机,黑色桌子1张。
甜糯黄玉米:由北京市农林科学院玉米研究中心选育出的新品种“京科2000”,在北京市及周边地区春、夏播均可,籽粒白色,硬粒,品质好,稳产性好。
甜妃:穗筒形,长粗,籽粒淡黄色,粒大饱满,具有良好的抗病虫害能力。
昌甜:籽粒呈红色,种子饱满,具有良好的抗倒伏能力。
为完成对甜糯黄玉米、甜妃、昌甜3种玉米种子的识别,采用手机原相机对玉米种子进行拍照,共拍摄150张图片。图像的采集在黑色桌面上进行。为了防止反光现象的发生,在图片采集过程中尽量保持垂直拍摄,在灯光稍暗的地方进行。
首先,对采集的原始图像进行裁剪,分辨率为454像素×454像素。为了简化图像分割的过程,将多粒玉米种子放在镜头中指定位置进行拍摄(一次拍摄放置10~12粒种子),将图片输入预先设计好的算法中进行图像分割,以此完成对单个玉米种子的图像分割。其次,对图像分割完成后的单粒玉米种子进行灰度处理,消除在拍摄时曝光过高带来的影响。最后,使用高斯滤波器对单粒种子图像进行降噪处理。
为了提高识别的准确度及模型的泛化力,测试在对分类器读取不同环境背景下拍摄的单粒玉米种子图片时分类器是否具有更好的学习能力。试验通过调整玉米种子图像的对比度、亮度及锐化程度将玉米种子图像进行数据扩增,图片数量扩增为原来的2倍,使试验的图像样本数目达到300张。
试验共提取15种特征,其中包括几何特征8种(周长、面积、颜色、长度、宽度、圆形度、矩形度和长轴长)、纹理特征7种(二阶矩、熵、对比度、逆差矩、差异性、能量和相关性)。
1.5.1 颜色特征。颜色特征是一种全局特征,主要用来表示图像中物体的表面性质。颜色特征是计算机视觉技术发挥作用的基础特征。种子颜色的细微变化可在一定程度上反映其新旧程度。
在试验中分别提取每一张图像的R、G、B 3个分量,并分别计算三者的平均值作为这张图像的颜色特征,再计算每一种类种子R、G、B的平均值,用作后期验证试验的对比数据。
1.5.2 几何特征。笔者将经灰度处理且降噪后的图像进行阈值分割,利用单个玉米种子图像的区域和边缘特性提取几何特征,提取的几何特征包括以下几个部分。
正交投影面积:利用Python中的cv2.contourArea函数计算分割后单个玉米种子的面积。
正交投影周长:利用Laparoscopic算子计算图像梯度,使用Canny算法对玉米种子图像进行边缘检测,得到图像的边缘像素,计算边缘像素点和。
矩形度:用正交投影面积除以最小外接矩形面积,以此来计算该玉米种子的矩形度。
长轴长:通过计算玉米种子外接矩形的对角线长度来定义长轴长。
长度:通过计算玉米种子外接矩形的长度来定义种子长度。
宽度:通过计算玉米种子外接矩形的宽度来定义种子的宽度。
圆形度:通过面积与周长的运算得到单个玉米种子的圆形度。
1.5.3 纹理特征。纹理特征是通过灰度共生矩阵提取出来的一个值,对区域内部灰度级变化的特征进行量化。图片的纹理特征具有旋转不变性,并且对于噪声有较强的抵抗能力,可以很好地诠释图像表面性质的全局特征。试验采用灰度共生矩阵(GLCM)对特征矩阵进行纹理特征分析,提取出熵(ENT)、对比度(CON)、逆差矩(HOMO)、差异性(DISL)、能量(NRG)、相关性(COR)和二阶矩(ASM)共计7种特征值。其中,熵是主要的纹理特征。
为了提高数据的泛化性,试验时将每张图片分别采用原图像、原图像旋转45°、原图像旋转90°、原图像旋转135°4种方式进行纹理特征的提取。
熵是用来衡量选取图像信息量的大小,图像中的元素越分散,熵越大,选取图像纹理的均匀程度越高。对比度反映了图像灰度的变化程度,图像中灰度值差别越大,表明图像边缘越锐利。逆差矩用来测量灰度图像局部强度的均匀性,局部越均匀,逆差矩越大。差异性对于局部特点衡量性较好,局部对比度越大,差异性越大。能量是对图像纹理的灰度变化稳定程度的度量,反映图像灰度分布均匀程度和纹理粗细度。相关性表示目标图像的灰度像素成线性关系的度量,代表灰度共生矩阵行列灰度关系的相似度。二阶矩反映图像的均匀性,值越大,图像灰度分布越均匀。
第一步:对玉米种子图像进行图像预处理,得到大小统一、清晰度高的图像。第二步:提取玉米种子图像的颜色特征、几何特征、纹理特征共15个特征向量。第三步:采用主成分分析法(PCA)将特征向量从15维降至2维。第四步:采用支持向量机对降维后的数据进行分类,其中70%的数据用于训练集,30%的数据用于测试集。第五步:将以上的数据模型与其他的组合模型进行模型对比,通过测试集准确率判断模型的优劣。
分别使用5种降维方法对提取出的15种特征向量进行数据降维,再将降维后的数据分别放入2种分类器中进行模型训练与结果测试。在对比5种降维方法的散点图后发现,利用主成分分析法(PCA)进行降维后的散点图样本之间分布的距离较大,对于特征数据的分类较为明显。图1中不同的几何形状分别表示了3种玉米种子特征向量的分布。相同种类之间重叠部分相对较少,可以明显地区分出不同种类种子之间的差别。
图1 特征数据降维图
通过主成分分析法(PCA)将玉米种子的15维特征数据降至2维,经过PCA降维后数据的第1主成分贡献率为99.12%,第2主成分贡献率为0.88%,累积贡献率为100%。而其他4种特征数据降维后的样本数据分布较为密集,分类效果不明显,精度不高,样本之间的间距较小,在结合分类器进行分类时无法明确表现出3种种子之间的特征差别,从而导致模型测试集准确率较低。由此可见,PCA可以最大限度地提取特征数据的相关性,体现出种类之间的差异性,从而把高维数据降维至低维空间内。但这仅能证明主成分分析法(PCA)在一定范围内具有较高的数据降维能力,并不能适应所有的样本容量。
将经主成分分析法降维后的数据分别结合支持向量机(SVM)和贝叶斯分类器,构建玉米种子分类模型PCA-SVM和PCA-Bayes。对比两种分类器对PCA降维后数据的分类准确率。
由试验可知,PCA-Bayes模型对甜糯黄玉米的种类识别率达到了86.35%,对甜妃的识别率为57.69%,而对昌甜的识别率仅为53.57%,总体来看识别率较低。而PCA-SVM 模型对3类种子的平均识别率达到了95.97%。相对于PCA-Bayes模型,PCA-SVM模型有着较高的识别准确率,可以更准确地区分3类种子之间的差别。
对分类而言,单一的贝叶斯分类器更适合于样本数据二分类。上述试验中导致贝叶斯分类模型准确率降低的原因是图像数据量不足,未能使模型得到充分的多分类训练,所以仅能保证对单一种类的玉米种子完成识别。
综上所述,在特征数据的降维阶段,主成分分析法可以更好地完成对特征向量的筛选,进而达到降维的目的,而其他4种降维方法在试验样本容量范围内未能清晰地划分出3个品种之间的差别。在分类器的选择上,通过试验得知PCA-SVM模型具有较高的品种识别准确率,可以无损、快速地完成对3个品种玉米种子的识别,准确率可以达到95.97%。
对图像进行特征提取,并对数据进行特征降维,可以有效提高图像识别的准确率,并且极大地缩短识别时长。为了提高噪声干扰图像的准确识别能力,严宇宸提出基于纹理特征提取的图像识别方法,利用机器学习方法对提取干扰图像的纹理特征,提高了模型对图像的识别能力。不同的特征数据需要经过测试去发现适合的降维方法。笔者提取了玉米种子的几何和纹理特征共15个特征向量,通过测试比对散点图发现主成分分析法降维对特征数据具有较好的分类效果。过量提取特征数据会增大分类器的识别难度,加大运算负荷,因此,对特征值进行合理的特征降维尤为关键。杨博雄等提取VGG-16神经网络fc3层的4096维特征后,使用PCA法将数据维度降至64维,不仅可以高效地提取特征数据,而且可以充分利用系统资源。曹靖城提出一种基于PCA降维的海量数据特征抽取技术,减少数据处理对系统计算资源的消耗,通过PCA将原始数据映射到若干主成分,以实现数据压缩。
将主成分分析法(PCA)与支持向量机(SVM)相结合是机器视觉领域常提及的一种模型。令晓明等通过试验,分析了不同维度的分类识别率和识别时间对模型的影响;选择一些分类能力强的,基于行人颜色频率特征和肤色特征检测的block作为级联的特征向量,减少了冗余block的干扰影响,突出行人特征,并结合支持向量机进行识别,在行人检测中的准确率比单一特征提高了将近23%。
大多数的分类器只能进行二分类。对此,可以通过组合多个二分类器来让分类器多次反复输出,从而实现品种多分类,如可以采用one-against-one和one-against-all两种方法来实现。此试验在训练时依次把每个类别的样本分别归为一类,其他剩余的样本归为另一类,这样3个类别的样本就构造出了3个SVM分类器。黄兴华等提出一种纹理特征融合与支持向量机(SVM)相结合的分类识别方法,完成了对道路垃圾图像识别及提取,在此试验中采用了oneagainst-one方法进行分类器的构建。
笔者在试验中提及的其他4种降维方法在结合支持向量机进行分类模型的构建时,准确率虽然不如PCA-SVM模型,但是在改变样本容量的大小后,准确率呈增长趋势。这说明PCA降维只是在这一样本数量的区间内具有较为明显的特征降维能力,后期还可以通过增加样本容量进一步进行降维准确性的验证。
此试验结果表明,PCA-Bayes分类模型对玉米种子的品种识别具有较高的准确率,可为后期构建玉米种子品种识别系统提供依据。
此试验提取了玉米种子图像的15个特征向量,对其采用包括PCA、LDA等在内的5种降维方法对数据进行特征降维,通过对比试验结果发现,PCA-SVM模型具有较高的分类准确率,准确率可达95.97%。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!