当前位置:首页 期刊杂志

基于多光谱特征融合技术的面粉掺杂定量分析方法

时间:2024-05-22

刘丰奎,张 翠,黄志轩,刘盼西,陈 达*

(1.上海安杰环保科技股份有限公司,上海 201906;2.天津大学 精密仪器与光电子工程学院,天津 300072)

面粉作为人们日常主食材料之一,是人体对铁、钙、锌、叶酸、维生素A、维生素B1等微量元素摄取的重要载体[1]。近年来广琪“霉面粉”、陕西渭南“毒面粉”、“泡打粉”等毒面粉事件层出不穷,严重危害了人体健康。因此,发展一种快速高效的面粉掺杂检测方法迫在眉睫。

目前常用的掺杂检测方法有高效液相色谱法[2]、气相色谱法[3]、质谱法[4]等。其中,高效液相色谱法主要针对高沸点掺杂物质,气相色谱法主要针对低沸点挥发性及半挥发性掺杂物质,质谱法主要针对痕量掺杂物质。这些方法具有测量精度高、重复性好的优点,但其测量仪器昂贵、操作流程繁琐、溶剂消耗量大、检测周期长等缺陷使之在大范围推广普及过程中困难重重,难以实现对面粉的无损检测。受限于我国当前人力、物力等条件,这些检测方法难以满足我国数以亿吨的面粉快速检测需求,也难以有效应对我国面粉安全检测的严峻局势。

在各项检测技术中,拉曼光谱(Raman)[5]、激光诱导击穿光谱(LIBS)[6]等光谱技术以其简单、快速、高通量、无损等显著优点,在食品安全快速检测中得到了初步应用[7-11]。拉曼光谱法可在进行大面积快速扫描的同时实现高效的微区分析[12],极有利于针对面粉这种非均匀复杂体系进行快速筛查。激光诱导击穿光谱技术可获得丰富的光谱波长信息以及强度信息[13],能进行样品组分元素的定性和定量研究,有效识别可能的掺杂成分。

为将拉曼光谱技术和激光诱导击穿光谱技术进行有效融合,本文引入多光谱特征融合技术(MFFT)。在MFFT模型中,依次通过自适应小波变换(AWT)算法和竞争性自适应加权算法(CARS)分别对Raman光谱和LIBS光谱进行背景噪声去除[14]和变量筛选[15]。最后通过将CARS所选择的Raman光谱特征与LIBS光谱特征进行简单的合并,以PLS算法[16]建立面粉掺杂模型。结果表明,基于特征融合的MFFT模型显著提升了面粉掺杂的定量分析精度及可靠性,具备良好的应用前景。

1 原理与方法

本文提出一种多光谱数据特征融合方法用以面粉掺杂组分的定量分析。该方法首先采用AWT算法分别扣除Raman光谱和LIBS光谱数据中的背景与噪音信息,随后采用CARS算法对AWT滤波后的两种光谱信息分别进行变量筛选,以准确提取掺杂物相应的Raman光谱和LIBS光谱特征变量。在此基础上,将Raman光谱和LIBS光谱的特征变量归并为一个向量,利用PLS进行建模,进而得到最终的MFFT模型。MFFT模型将Raman光谱和LIBS光谱的特征信息进行有机融合,充分发挥了拉曼光谱中分子组分信息和激光诱导击穿光谱中原子组分信息之间的互补特性,获得了更为全面的面粉样品特征,有利于提升掺杂组分的定量分析精度。

MFFT方法的实际执行流程如下:

(1)制作面粉掺杂样品,设置实验参数,进行光谱数据采集;

(2)将采集的拉曼光谱和激光诱导击穿光谱进行自适应小波变换,其小波基和分解尺度分别设为‘sym5’和6,由此去除两种光谱的背景和噪声信号,并将其归一化;

(3)采用竞争自适应加权算法,分别对经自适应小波变换滤波后的拉曼光谱和激光诱导光谱进行变量筛选,准确提取两种光谱的特征变量;

(4)将提取的拉曼光谱和激光诱导击穿光谱的特征变量进行融合,并采用PLS建模,得到MFFT定量分析模型;

(5)分别基于单一拉曼光谱和激光诱导击穿光谱建立面粉掺杂组分的PLS定量模型,并与MFFT模型的预测结果进行比较分析;

(6)采用MFFT模型预测未知样本中掺杂组分的浓度信息。

2 实验部分

2.1 仪 器

拉曼光谱仪由本实验室自制。该仪器采用空间自由光路设计,激光波长为785 nm,激光功率为100 mW,分光狭缝为25 μm,积分时间为200 ms。

激光诱导击穿光谱仪(海洋光学LIBS-2500型),波长测量范围为200~880 nm,采用7通道的CCD阵列检测器(7×2 048像素),光谱取样间隔为0.05 nm,共获得13 600个光谱变量。

在光谱信号处理过程中,采用MATLABR2014a编程软件(美国The Math Works公司)进行算法的优化和数据计算。

2.2 样品制备

以掺杂面粉体系作为研究对象,选取市售14个品牌33种面粉作为标准面粉样品。根据均匀设计的原则[8],二氧化钛、硫酸铝钾(天津荣创先科科技发展有限公司)的掺杂量设为0~3.3%,掺杂浓度间隔为0.05%。实验采用上海沪西XW-80A微型涡旋混合仪对掺杂样品进行120 s的涡旋振荡混匀操作,获得66个不同浓度的掺杂面粉样品。

为了降低掺杂面粉样品物理形态对光谱测量结果的干扰,采用压片法对面粉样品进行处理。在压片实验中,称取15 g(精确至0.1 mg)掺杂面粉样品,送入压片机的样品腔,并在20 MPa的压力下将其压制成直径20 mm,厚度10 mm的片状,用于后续拉曼光谱和激光诱导击穿光谱检测。

2.3 参数设置

2.3.1 拉曼光谱光谱采集范围为220~2 200 cm-1,光谱取样间隔为1.95 cm-1,得到1 024个光谱变量。为了提升光谱测量的稳定性,单个样品扫描20次取平均。

2.3.2 激光诱导击穿光谱延迟时间为3.33 μs,会聚透镜与样品之间的相对距离为6.8 cm。为了提升LIBS光谱测量的稳定性,每个样品选取10个点进行测量,每个点进行10次采样,即单样进行100次光谱采集并求平均。

3 结果与讨论

3.1 光谱信号预处理

面粉是一种非均匀复杂体系,所含成分复杂多变,导致其光谱信号易受样品表面形态、检测环境等因素的影响,光谱数据中包含大量的背景和噪声信息。这些背景与噪声信号可能掩盖待测组分的特征信号,增加实验数据处理的复杂性。为了有效去除这些背景与噪声信号,采用AWT算法对获得的Raman光谱和LIBS光谱信号进行处理。

AWT算法以时/频多尺度分解的方式,将光谱中的背景与噪音信息分别划分到低频部分和高频部分,而将待测组分的特征信号划分到中间频率部分,进而高效地实现了光谱信号背景与噪音的扣除。本文在实际计算过程中,采用sym5小波基、分解尺度为6的小波变换参数,并将相应的尺度6的低频信息作为背景扣除,将尺度1和尺度2的高频信息作为噪音扣除,其计算结果如图1所示。由图可见,经AWT处理后的光谱信号基线平整且噪音水平显著降低,该结果表明AWT能有效克服拉曼光谱中背景与噪音的干扰,为后续的特征变量筛选提供良好的基础。

3.2 变量筛选

尽管AWT算法可以有效扣除光谱的背景与噪音信息,但AWT变换后的拉曼光谱波长和激光诱导击穿光谱波长冗余变量较多,易掩盖待测掺杂组分的特征信息。本文采用CARS算法进行变量筛选,以加强模型的稳健性。CARS算法采用达尔文进化论中的“适者生存”理论,以迭代的方式将部分权重较小的变量删除,并对保留变量重新计算权重,一直迭代到变量数至2为止。与此同时,以CARS算法对中间筛选的变量组合进行交叉验证,并计算相应的交叉验证误差(RMSECV),对应最小RMSECV的变量集合即为最佳变量集合。

以二氧化钛的拉曼光谱变量筛选为例,其CARS计算结果如图2所示。由图2A可见,当样本迭代次数为245时,相应的RMSECV值降到最低。由图2B可见,最小RMSECV值对应的变量个数为48个,较原有的1 024个变量压缩了21.3倍,有效降低了面粉基质对二氧化钛定量的干扰。图2C显示了不同变量对应模型的权重系数变化趋势,第245次迭代时处于一个较均衡的状态,说明此处的变量组合具备良好的线性关系。硫酸铝钾的拉曼光谱特征信息筛选过程与二氧化钛类似,最终选择85个波长变量为特征变量,用于后续的多光谱特征融合。

图1 AWT处理前后拉曼光谱图和LIBS光谱图的比较Fig.1 Effects of AWT on Raman spectra and LIBS spectraA.raw Raman spectra,B.AWT filtered Raman spectra,C.raw LIBS spectra,D.AWT filtered LIBS spectra

图2 二氧化钛模型的拉曼光谱变量筛选图Fig.2 Variable selection of Raman spectra for prediction of titanium dioxide modelA.trend graph of CARS selected variables,B.curve of root mean square errors for CARS models,C.curve of regression coefficient for CARS selected variables

与拉曼光谱特征选择相似,针对二氧化钛的LIBS光谱变量筛选结果如图3所示。由图3A可见,当样本迭代次数为228时,相应的RMSECV值降到最低。图3B则显示最小RMSECV值对应的变量个数为334个,较原有的13 600个变量压缩了40.7倍,有效降低了面粉基质元素对二氧化钛特征元素的干扰效应。图3C证明在第228次迭代时所获得的变量组合具备良好的线性关系。硫酸铝钾的LIBS光谱特征信息筛选过程与二氧化钛类似,最终选择254个波长变量为特征变量,用于后续的MFFT建模。

图3 二氧化钛模型的LIBS光谱变量筛选图Fig.3 Variable selection of LIBS spectra for prediction of titanium dioxide modelA.trend graph of CARS selected variables,B.curve of root mean square errors for CARS models,C.curve of regression coefficient for CARS selected variables

在拉曼光谱与LIBS光谱变量筛选的基础上,将筛选出的特征变量进行融合,获得二氧化钛和硫酸铝钾的多光谱融合数据,其对应的总变量个数分别为382、339。

3.3 建模分析

在特征变量融合的基础上,采用PLS算法对获取的二氧化钛融合光谱、硫酸铝钾融合光谱数据以及单一光谱数据分别进行建模处理,其预测模型的相关系数如表1所示。

表1 基于不同光谱的二氧化钛和硫酸铝钾模型预测结果Table 1 The prediction results for the titanium dioxide and aluminum potassium sulfate in flour samples using different spectroscopies

由表1可见,基于特征融合光谱建立的二氧化钛和硫酸铝钾的定量分析模型相对于基于单一光谱建立的定量分析模型性能有了明显提高。其中,对于二氧化钛的定量模型而言,基于融合光谱建立的模型比基于单一拉曼光谱、LIBS光谱建立的模型的相关系数分别提高了10.1%、9.5%,而预测误差分别下降了54.3%、50.4%。与此类似,采用MFFT算法后,硫酸铝钾模型的相关系数分别提高了11.7%、9.3%,而预测误差分别下降了55.8%、50.7%。计算结果表明,多光谱特征融合技术可以准确提取Raman光谱中的分子信息和LIBS光谱中的元素信息,使其互为补充、互为校正,进而有效克服面粉基质对掺杂组分定量分析的干扰,显著提高模型的预测精度。

4 结 语

本文提出了一种基于多光谱融合特征技术的面粉掺杂定量检测方法,该方法不仅可有效扣除各种光谱信号中的背景噪声信息,还能准确提取特征变量,为后续定量分析提供精准信息支撑。多光谱特征融合技术以数据融合的方式,使拉曼光谱中的物质组分信息与LIBS光谱中的元素组分信息互为补充、互为校正,巧妙地降低了面粉基质对掺杂组分定量分析的干扰,显著提高了面粉掺杂模型的预测精度,为面粉掺杂的定量检测提供了一种新的技术手段。同时,也为其他复杂体系的定量分析提供了技术参考和借鉴。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!