时间:2024-05-28
张正勇,宋 超,沙 敏,刘 军,王海燕
(1.南京财经大学管理科学与工程学院,江苏南京210023; 2.江苏省质量安全工程研究院,江苏南京210023)
紫外可见光谱结合化学计量学方法用以古井贡酒年份快速鉴别
张正勇1,2,宋超1,沙敏1,2,刘军1,2,王海燕1,2
(1.南京财经大学管理科学与工程学院,江苏南京210023; 2.江苏省质量安全工程研究院,江苏南京210023)
实验以古井贡酒8年、16年、26年年份酒为对象,研究了基于紫外可见光谱的白酒年份酒快速鉴别方法研发的可能性。通过采集实验样品的紫外可见光谱,构建了该品牌年份酒与紫外可见最大吸收峰(277 nm)强度关系图,古井贡酒8年酒紫外可见最大吸收峰强度围绕1.017±0.127范围波动,古井贡酒16年酒紫外可见最大吸收峰强度围绕1.855±0.410范围波动,古井贡酒26年酒紫外可见最大吸收峰强度围绕2.494±0.130范围波动,基于此可进行初步的年份酒判别分析。同时,利用古井贡酒年份酒紫外可见光谱全谱数据,运用核主成分分析方法,这是主成分分析法在非线性领域的推广,可有效避免数据冗余,提高特征提取效率,进而结合最近邻算法、稀释识别表示分类器,实现白酒年份酒快速、高效、智能鉴别。结果表明,在交叉验证实验条件下识别率可达93.75%。本方案的提出可为白酒年份酒品质保证提供一种简单、快速的鉴别方法。
核主成分分析; 模式识别; 紫外可见光谱; 年份酒; 古井贡酒
从古井贡酒首次提出年份原浆酒以来,白酒年份酒顺应市场需求,迅速成为白酒市场的重要组成部分。在白酒年份酒市场蓬勃发展的同时,其年份酒也面临着诸多挑战,如假冒伪劣、以次充好等现象时有报道,迫切需要发展相应鉴别技术。在白酒年份酒监管鉴别技术研究领域,目前尚无适用的国家标准,研究人员提出的主要鉴别技术包括:徐占成[1]提出了白酒年份鉴别挥发系数法,通过构建白酒年份酒存储年限与挥发物含量间的函数关系,实现白酒年份鉴定。杨涛等[2]提出,利用年份酒中Al、Fe、Cu等金属离子在不同年份酒中含量变化关系,利用酒体黏度与白酒贮存时间关系,利用白酒中微量共轭不饱和双键分子与年份酒贮存时间关系,多个方面鉴别年份酒。秦人伟[3]提出利用碳-14衰变率与年份酒贮存时间关系,鉴别确定年份酒生产年份。本课题组前期研究提出利用拉曼光谱法结合支持向量机算法,实现了白酒年份指数回归分析[4]。以上研究方法,为白酒年份酒鉴别提供了多种鉴别方案,不过这些方法,或需要较为专业的大型仪器设备,或分析步骤较为繁琐、分析时间较长。目前,白酒年份酒市场日益庞大,待检样品数量日益增多,如何发展简单、实用的快速检测鉴别技术,成为新的迫切需求。
本研究提出了一种基于紫外可见光谱结合化学计量学算法的古井贡酒年份酒快速鉴别方法。紫外可见光谱仪器价格较为低廉,属于常用光谱设备,体积较小,便于携带,测试步骤也较为省时省力。通过收集多批次不同年份古井贡酒年份酒的紫外可见光谱数据,构建紫外可见吸收峰值与年份酒关系,并结合化学计量学算法,可实现古井贡酒年份快速鉴别。
1.1材料
材料:古井贡酒年份酒购置于安徽古井集团有限责任公司,包括8批次古井贡酒年份酒8年酒,14批次古井贡酒年份酒16年酒,6批次古井贡酒年份酒26年酒。
仪器:T6新世纪型号紫外可见光谱仪,北京普析通用仪器有限责任公司。
1.2数据处理
紫外可见光谱原谱数据使用mapm inmax函数(matlab软件平台)实现数据的归一化操作。归一化后的紫外可见光谱数据使用princomp函数进行主成分分析(PrincipalComponentAnalysis,PCA),使用KPCA算法进行核主成分分析(Kernel Principal Component Analysis,KPCA)。特征提取算法PCA和KPCA分别结合最近邻算法(Nearest Neighbor,NN)、稀疏表示分类器(sparse representation classification,SRC)和支持向量机(SupportVectorMachine,SVM)实现对古井贡酒年份酒机器识别。
1.3核主成分分析法(KPCA)
KPCA是PCA在非线性领域的推广[5-6]。传统的PCA只考虑了数据的二阶统计特性(协方差矩阵),并未考虑到数据的高阶统计特征,所以变换后依然会存在数据间的高阶冗余信息。核函数技术是通过非线性核函数把输入空间映射到高维空间,以期望把低维空间的非线性运算转换成高维空间的线性运算。因此,KPCA的原理在于首先通过非线性映射将线性不可分的原始样本输入空间变换到一个线性可分的高维特征空间,然后在新的空间里进行主成分分析,为避免“维数灾难”问题,引用核函数技术,即使用满足Mercer条件的核函数来替换特征空间中样本的内积运算。
从本质上说,核函数技术构建了数据空间、特征空间和类别空间之间的非线性变换的桥梁,设xi和xj为数据空间的样本点,数据空间到特征空间的映射函数为Φ,核函数的基础是实现向量的内积变换:
通常,非线性变换函数Φ(·)相当复杂,而实际运算过程中用到的核函数K(·,·)则相对简单得多,这正是核函数技术的巨大优势。
常用的核函数如下:
a.线性(Linear)核函数
b.多项式(Ploynom ial)核函数
其中d是正整数,该函数满足Mercer条件。
c.高斯(Gaussian)核函数
其中σ为控制核函数高宽的参数。
1.4交叉验证
本实验的交叉验证是结合了传统K层交叉验证(KCV)和交叉验证留一法(Leave-one-out)方法的特点而专门设计的方法。这样的设计目的:一是在不重复的情况下提高样本的利用效率;二是提高实验的稳定性,使得每次方法都能在同样的交叉验证基础上进行,以提高方法之间可对比性。具体的方法设计如下:针对6批次古井贡酒26年酒,样本编号为A1—A6,14批次古井贡酒16年酒,样本编号为B1—B14,8批次古井贡酒8年酒样本,编号为C1—C8。根据数学组合的原理,实验测试样本选取如下:
A1A2;B1 B2 B3 B4;C1C2
A3A4;B5 B6 B7 B8;C3C4
A5A6;B9 B10 B11 B12;C5C6
A1A2;B13 B14;C7C8
A3A4;B1 B2 B3 B4;C3C4
A5A6;B5 B6 B7 B8;C1C2
A1A2;B9 B10 B11 B12;C7C8
A3A4;B13 B14;C5C6
8次实验共计60个测试样本,每次实验中未被选中的其他样本作为训练集,本研究的化学计量学实验均是基于此交叉验证条件进行的。
2.1古井贡酒年份酒紫外可见光谱分析
中国白酒属于蒸馏酒,常用的制酒过程是:取一定配比的粮食,如高粱、玉米等,混合并于发酵池中发酵一定时间后,蒸馏获取基酒,而后贮存数月至数年,使得基酒中各分子充分缔合,再经过勾兑、调和,最终制成各具特色的白酒成品酒。可见时间是白酒生产过程中关键性因素之一,影响着白酒的最终风味。本实验选取古井贡酒年份酒8年、16年、26年为研究对象,首先采集了实验样品的紫外可见光谱图,如图1所示,可以看出古井贡酒年份酒在250~400 nm处有1个紫外可见吸收峰,在277 nm处有最大吸收峰,此紫外可见吸收峰可主要归结于白酒组成成分中不饱和分子的外层电子π—π*跃迁所致,如糖醛分子等[7]。并且,随着古井贡酒年份的增加,紫外可见最大吸收峰表现出相应增加趋势,原因可归结于随着年份的增加,白酒贮存过程中不饱和键分子含量增加所致,如二醛、二酮化合物及其缩合物分子等。
图1 古井贡酒年份酒紫外可见光谱图
根据古井贡酒年份酒紫外可见光谱信息,绘制年份与紫外可见光谱最大吸收峰强度关系图,如图2所示。古井贡8年酒紫外可见最大吸收峰强度围绕1.017±0.127范围波动,古井贡16年酒紫外可见最大吸收峰强度围绕1.855±0.410范围波动,古井贡26年酒紫外可见最大吸收峰强度围绕2.494±0.130范围波动。据此可以看出随着古井贡年份酒年代增加,紫外可见最大吸收峰强度值依次增强,古井贡8年酒与古井贡26年酒区分明显,借助紫外可见最大吸收峰强度有望实现直接判别,古井贡16年酒最大紫外可见吸收峰介于二者之间,此方法有望用于古井贡酒年份酒快速鉴别。
图2 古井贡酒年份酒年份与紫外可见光谱最大吸收峰强度关系图
2.2古井贡酒年份酒鉴别模型分析
借助古井贡酒年份酒紫外可见最大吸收峰值,初步实现古井贡酒年份酒快速鉴别,不过,在古井贡酒16年酒的紫外可见最大吸收峰强度值与古井贡8年酒或26年酒最大吸收峰强度值存在交叉区域情况时,这种直接判定方法将难以奏效。于是,进一步研究了主成分分析法、核主成分分析法,结合模式识别分类算法,充分利用紫外可见光谱全谱数据,实现古井贡酒年份酒快速鉴别。
PCA与KPCA均为数据特征提取方法,分别将PCA和KPCA算法结合NN、SRC和SVM分类器[8-10],利用古井贡酒年份酒紫外可见光谱数据进行样本识别分析,表1和表2给出了相应识别效果。从表1可以看出,在选取的主成分累计贡献率均大于99%的情况下,PCA结合SVM分类模型所得到的识别率最高,达到88.54%,这是由于SVM算法设计在对于有限样本处理时具备优势所得。从表2可看出,KPCA结合NN分类模型以及KPCA结合SRC分类模型分别在核参数寻优条件下,识别率可以达到93.75%,相对较差的KPCA结合SVM模型识别率也可以达到91.67%。其次,不同的分类器对于核函数选择和参数选取不同,NN和SVM分类器都是在多项式核函数下达到最优结果,而SRC在高斯核函数下得到最优值。
对比表1和表2可以看出,相比较于PCA,KPCA特征提取的效果更好,在结合3种不同的分类器下,识别率都有所提高,其中,SRC对于特征提取的效果敏感性最高,识别率从52.08%提高到93.75%,SVM敏感性最低,NN次之。分析原因,在于KPCA中核函数的使用为非线性数据的降维提供了可能,在结合分类器下,提高了模型的推广性。
图3给出了古井贡酒年份酒结合NN分类器下的主成分分析图,坐标轴代表着前3个主成分PC1、PC2和PC3。图4给出了古井贡酒年份酒结合NN分类器下的核主成分分析图,坐标轴代表着前3个核主成分KPC1、KPC2和KPC3,图4中核参数的选择为:Polynom ial,d= 2。对比图3和图4可以看出,PCA降维下的古井贡酒不同年份酒样本之间有重叠,这为分类带来了困难,而KPCA降维下的样本分布较好,不同类别样本实现了良好的分类。
表1 PCA降维方法结合3种分类器的识别率效果
表2 KPCA降维方法结合3种分类器的识别率效果
图3 古井贡酒年份酒主成分分析图
图4 古井贡酒年份酒核主成分分析图
综合来看,KPCA相比较于PCA在特征提取上优势明显,并在实际的降维图和识别率上保持了一致性。KPCA结合NN、SRC、SVM分类算法分析,实现了古井贡酒年份酒8年、16年、26年的快速鉴别,并在KPCA结合NN模型和KPCA结合SRC模型下,经过核函数调优,都可以达到93.75%的识别率。
针对白酒年份酒快速鉴别技术的匮乏,本文提出了基于紫外可见光谱结合核主成分分析法、模式识别算法的古井贡酒年份酒快速鉴别方法。利用古井贡酒年份酒紫外可见光谱数据,构建了古井贡酒年份酒年份与紫外可见最大吸收峰强度关系图,初步实现古井贡酒年份酒直接判别。利用古井贡酒年份酒紫外可见光谱全谱数据,结合核主成分分析与最近邻算法、稀疏表示分类器,实现了古井贡酒年份酒年份智能识别,识别率达到93.75%。本方案的提出为白酒年份酒的快速鉴别技术的发展提供了新思路,并可为其他食品、药品质量安全鉴别技术的开发等所借鉴。
[1] 徐占成.中国白酒贮存年份科学鉴别技术的研究——“挥发系数鉴别年份酒的方法”[J].酿酒科技,2009(1):96-98.
[2]杨涛,李国友,庄名扬.中国白酒“年份酒”鉴别方法的研究[J].酿酒,2008,35(5):33-38.
[3]秦人伟.碳-14用于年份酒时间的测定[J].酿酒科技,2014(8):89-93.
[4] 王国祥,王海燕,王虎,等.基于Raman光谱和支持向量机回归的古井贡酒年份鉴别方法[J].光谱学与光谱分析,2016,36 (3):729-735.
[5]Vinay A,Shekhar V S,Murthy K N B,etal.Face recognition usinggaborwavelet featuresw ith PCA and KPCA-a comparative study[J].Procedia Computer Science,2015,57:650-659.
[6]Musa A B.A comparison ofℓ1-regularizion,PCA,KPCA and ICA for dimensionality reduction in logistic regression[J]. International JournalofMachine Learning and Cybernetics, 2013,5(6):861-873.
[7]Zhang Z,Jiang J,Wangg,etal.Application of twodimensionalcorrelation UV-Visspectroscopy in Chinese liquor Moutaidiscrimination[J].American Journalof Analytical Chem istry,2015,6(5):395-401.
[8]Wright J,Ma Y,Mairal J,etal.Sparse representation for computer vision and pattern recognition[J].Proceedingsof the IEEE,2010,98(6):1031-1044.
[9]MujaM,Lowe DG.Scalablenearestneighboralgorithms for high dimensionaldata[J].IEEETransactionson Pattern Analysisand Machine Intelligence,2014,36(11):2227-2240.
[10]BurgesC JC.A tutorialon supportvectormachines for pattern recognition[J].DataM ining and Know ledge Discovery,1998,2(2):121-167.
Rapid Identification of the Ageofgujinggongjiu Liquor by Ultraviolet Visible Spectroscopy Coup led w ith Chemometric M ethods
ZHANG Zhengyong1,2,SONG Chao1,SHAM in1,2,LIU Jun1,2andWANGHaiyan1,2
1.SchoolofManagementScienceand Engineering,Nanjing University of Financeand Economics,Nanjing,Jiangsu 210023; 2.Jiangsu Research Institute of Quality and Safety Engineering,Nanjing,Jiangsu 210023,China)
In the experiment,Gujinggongjiu Liquorof 8,16 and 26 years respectively wasused as the research object,and the feasibility of using ultravioletvisible spectroscopy coupled w ith chemometricmethods for rapid identification of liquoragewasstudied.The UV-Vis spectra of the experimental samples were collected and then the relationship diagram between liquor age and the intensity of themaximum absorption peak(277 nm)of UV-Vis spectra had been constructed.The intensity ofgujinggongjiu Liquor of 8 yearswas located in the range of 1.017± 0.127.The intensity ofgujinggongjiu Liquorof 16 years and of 26 yearswas located in the range of 1.855±0.410 and in the range of 2.494± 0.130,respectively.Accordingly,prelim inary discriminate analysis of liquor age could be obtained based on the relationship diagram.Meanwhile,totalUV-Vis spectra data ofgujinggongjiu Liquor of 8 years,16 years and 26 yearswere investigated by using kernelprincipal componentanalysis(KPCA),whichwas thegeneralized application in nonlinear field of principal componentanalysis(PCA)and could avoid data redundancy aswellas improve the efficiency of feature extraction.Finally,rapid,efficientand intelligent identification ofgujinggongjiu Liquor of different ages could be achieved by using KPCA combined w ith the nearest neighbor(NN)and sparse representation classification(SRC). The experimental results displayed that the recognition ratewas up to 93.75%.This study provided a simple and rapidmethod for the identification of Baijiu of differentages.
kernel principal componentanalysis;pattern recognition;ultraviolet visible spectroscopy;Baijiu of differentages;Gujinggongjiu Liquor
TS262.3;TS261.7;TS261.4
A
1001-9286(2016)11-0020-04
10.13746/j.njkj.2016237
江苏省高校自然科学研究面上项目(16KJB150015),国家重大科学仪器设备开发专项(2013YQ090703),国家自然科学基金(61373058,71433006),科技部港澳台科技合作专项项目(2014DFM 30080),质检公益性行业科研专项(201410173),南京财经大学青年学者支持计划(2015)基金。
2016-07-26;
2016-09-07
张正勇(1984-),男,安徽霍邱人,讲师,博士,E-mail:zyzhang@njue.edu.cn。
王海燕(1968-),女,安徽巢湖人,教授,博士,E-mail:njue_10@163.com。
优先数字出版时间:2016-10-12;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20161012.1515.018.htm l。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!