当前位置:首页 期刊杂志

基于近红外光谱与组合间隔偏最小二乘法的稻米镉含量快速检测

时间:2024-07-28

朱向荣 李高阳 苏东林 刘 伟 单 杨(1.中南大学研究生院隆平分院,湖南 长沙 410125;2.湖南省食品测试分析中心,湖南 长沙 410125)

镉(cadmium,Cd)是一种毒性大,迁移性强的重金属元素,Cd在土壤中有较高活性[1],Cd污染是土壤和食品中重金属污染关注的首要问题之一。水稻被认为是镉吸收最强的大宗谷类作物[2],很容易吸收土壤中的镉。水稻镉污染不仅导致水稻产量下降,更为严重的是镉元素在水稻植株内大量累积,并通过食物链进入人体,对人类健康带来严重危害[3]。中国GB 2762—2012《食品中污染物限量》规定稻米中镉的最高限量为0.2mg/kg,因此,对稻米中镉含量进行质量控制,保障稻米食用安全,采用灵敏、准确的分析方法检测稻米镉含量尤为重要。目前,国内外研究者[4]常采用电感耦合等离子体原子发射光谱与石墨炉原子吸收光谱法等仪器分析方法测定农产品中Cd含量。上述方法虽然准确性好,专属性强、灵敏度高,但也存在着样品消化时间长、强酸试剂消耗量大、环境危害较大、仪器操作复杂等缺点。

近红外光谱法(near-infrared spectroscopy,NIRS)是目前发展较为迅速的分子光谱快速检测技术,具有快速、无损、绿色、环境友好等优点。NIRS在稻米中淀粉、蛋白质、氨基酸、脂肪、矿质元素、水分、脂肪酸值等营养指标的含量检测等领域均有应用。从原理上讲,无机元素在近红外光谱区并没有吸收,但是有机物质通过螯合或络合的方式与无机元素形成螯合物或络合物,而这些物质在近红外光谱区有相应的响应与吸收[5]。稻米的主要有机成分为淀粉和蛋白质,其含量分别约为80%和8%。镉元素与淀粉及蛋白质中的C—H、N—H与O—H等基团结合,而使得采用近红外光谱检测镉成为可能。近年来,国外学者采用NIRS结合化学计量学方法对动物样 品[6,7]、植物样品[8-11]以及 水样[12,13]中重金属元素定性、定量分析,Kumagai等[14]采用NIRS对镉污染稻米进行定性研究,但尚未见到采用NIRS对稻米镉进行定量研究的报道。本研究拟通过NIRS与组合间隔偏最小二乘法(synergy interval partial least squares,siPLS)组合,建立稻米镉含量是否超标的NIRS定量模型,并对光谱预处理方法与光谱变量筛选进行系统的考察,以达到预期的效果。

1 材料与方法

1.1 仪器与试剂

石墨炉原子吸收光谱仪:AA-6800型,日本岛津公司;

傅里叶变换近红外光谱仪:Nicolet AntarisⅡ型,美国Thermo公司;

硝酸、高氯酸:优级纯,国药集团化学试剂有限公司。

1.2 试验方法

1.2.1 样品收集 在湖南省长沙市周边收集了72个稻米样品(40个样品采自湘阴县浩河口镇,10个样品采自长沙县大同桥镇,12个样品采自长沙县江背镇,10个样品采自长沙县干杉镇)。样品经烘干(85℃,2h)、去壳、粉碎、过60目筛4个步骤。

1.2.2 镉含量的测定 按 GB/T 5009.15—2003《食品中镉的测定》执行。

1.2.3 NIRS方法 利用积分球漫反射检测系统完成样品近红外光谱的采集,NIRS扫描波数范围4 000~10 000cm-1。NIRS方法经优化后,样品光谱采集的工作流(workflow)确定为:分辨率8cm-1,扫描次数32次,增益为2,以内置背景为参考。每个样品重复3次扫描,取其平均光谱,以消除样品不均匀性带来的干扰。

1.2.4 组合间隔偏最小二乘法 偏最小二乘回归法(partial least squares regression,PLSR)是多元校正中经典的定量建模方法之一。在建模的过程中,为了不丢失光谱信息,PLSR常采用全光谱(full spectrum)数据进行建模,但是全光谱中无信息变量(uninformative variables)过多,将会导致模型过拟合,预测结果变差。因此,需采用变量筛选方法提取特征变量,提高NIRS模型的精度。间隔偏最小二乘法[15](interval partial least square,iPLS)是将全光谱分为n个等宽子区间,然后对每个子区间进行局部建模,得到误差最小,相关系数最大的子区间。组合间隔偏最小二乘法(siPLS)是iPLS的一个扩展,该方法的主要原理是以交叉验证均方根误差为指标,对全光谱不同子区间(比如2、3以及4个区间)进行任意组合,采用多元回归方法建立定量模型,最终得到最优的光谱变量区间组合以及相应的模型[16]。

1.2.5 模型评价 采用模型相关系数(R)、交叉验证均方根(RMSECV)与预测集验证均方根(RMSEP)进行评价,分别按式(1)~(3)计算:

式中:

ci——试验值,mg/kg;

n——校正集样本数;

m——预测集样本数。

1.2.6 统计分析 利用MATLAB软件进行。

2 结果与讨论

2.1 校正集的选择

采用NIRS数据进行建模,选择有代表性的校正集样品进入到校正模型的数据库,不但可以降低过拟合风险、提高模型的预测精度,还可以减少建模的工作量。本研究共收集72个稻米样本,采用基于马氏距离的Kennard-Stone(KS)法[17]依次从整个样本集(samples set)挑选54个样品作为校正集(calibration set),18个样品作为预测集(prediction set)。

2.2 光谱分析

图1为代表性样品在4 000~10 000cm-1的NIRS图,主要吸收峰光谱解析为[18]:8 423.5cm-1附近的吸收峰为C—H键振动的二级倍频,6 907cm-1附近的吸收峰为O—H键伸缩振动的一级倍频,6 480cm-1附近的吸收峰为N—H键伸缩振动的一级倍频,5 720cm-1与5 900cm-1两处吸收峰对应的是C—H键的一级倍频,5 200cm-1附近的吸收峰为O—H键振动组合频,4 830cm-1附近的吸收峰为N—H键伸缩振动与弯曲振动的组合频,4 390cm-1附近的吸收峰为C—H振动的组合频。

图1 稻米样品代表性的近红外光谱图Figure 1 NIR spectrum of rice sample

2.3 光谱预处理比较

采集的NIRS中,光谱的背景噪声、物理因素导致的光散射与量纲不一致等将对建模的准确性产生重要影响[19]。因此,需要对光谱进行预处理,以减少上述影响。在全光谱范围内,以RMSECV值及Rc(训练集相关系数)进行评价指标,考察了Savitzky-Golay(SG)平滑、中心化(meaning)、自归一化(autoscaling)及多元散射校正(multiple scattering correction,MSC)等5种数据预处理方法对稻米样品的NIR光谱模型的影响。最终确定了平滑、中心化以及多元散射校正作为光谱预处理最优方法。

2.4 基于siPLS法的特征变量选择

本研究采集的近红外原始光谱包含1 557个变量,在多元变量校正时包含着不相关或冗余信息,利用全光谱建立校正模型存在着过拟合风险。因此,采用特征变量选择方法对全光谱变量进行筛选,能减少模型的变量数,降低模型的复杂性,提高模型的预测性能。本试验分析了siPLS特征变量提取方法,并与全光谱建模结果进行比较。SiPLS法具体步骤:将全光谱划分为60个区间,每个区间26个变量,然后对不同区间进行组合,得到RMSECV值最小的子区间组合。本试验考察了siPLS法不同子区间个数的组合对模型的影响,确定3个区间组合次数时,RMSECV值最低,Rc值最大。

图2为训练集建模时前10个主因子数与所对应的RMSECV值的相关图。由图2可知,当主因子数为9时,RMSECV值最小。

图2 主因子数与RMSECV的相关图Figure 2 The correlation diagram of PLS components and RMSECV

表1列出了前10个区间组合所对应的波数位置、主因子数以及RMSECV值,由表1可知,组合区间为[21 30 38]时,对应的主因子数为9,此时RMSECV值最小,为0.247。

采用siPLS法得到的最优区间组合为[21 30 38],21,30与38三区间在全光谱对应的波数位置见图3,分别为6 005.2~6 101.6,6 907.8~7 004.2与7 710.0~7 806.4cm-1。具体NIRS解析为[18]:6 005.2~6 101.6cm-1为C—H伸缩振动的一级倍频,6 907.8~7 004.2cm-1为蛋白质N—H反对称伸缩振动一级倍频以及淀粉O—H伸缩振动的一级倍频。7 710.0~7 806.4cm-1为C—H伸缩振动的一级倍频伸缩振动的第二组合频。

表1 RMSECV最低的前10个组合区间及其对应的主因子数Table 1 The top 10intervals corresponding to PLS component and RMSECV using siPLS

图3 采用siPLS算法选择波段在全谱中的位置Figure 3 Spectral subintervals were selected by siPLS algorithm

采用siPLS法选择NIRS特征吸收波数,建立稻米镉PLS定量模型并进行预测,训练集中54个样品ICP—MS测定的试验值与NIRS预测值的相关图见图4。由图4可知,样本号为8#、30#与31#的样品预测相对较差。此时,模型校正集 RMSECV为0.247,训练集相关系数(Rc)为0.919。

图5为预测集中18个样品ICP—MS测定的试验值与NIRS预测值的相关图。预测集RMSECV为0.261,预测集相关系数(Rp)为0.895。

图4 训练集中试验值与预测值的相关图Figure 4 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=54)

图5 预测集中试验值与预测值的相关图Figure 5 Prediction value vs.ICP—MS measurement for the determination of actual content in the calibration set(n=18)

2.5 全谱和特征波长选择模型的比较

为了评价siPLS法在稻米镉定量建模变量选择中的重要性,本研究采用2.3节相同的光谱预处理手段,建立了全光谱的PLS模型。由表2可知,采用全光谱建立的PLS模型的预测结果比siPLS法都要差,这说明采用siPLS法对原始光谱进行特征波长选择,主要成分信息得到最大保留,冗余信息得到部分去除,预测能力得到提高。

表2 siPLS法与PLS建模结果比较Table 2 Comparison of the results of siPLS and PLS

3 结论

本研究采用近红外光谱与组合间隔偏最小二乘法相结合,初步实现了镉污染稻米中镉含量的定量检测。结果表明,采用siPLS法选择特征变量再进行建模,所得结果优于全谱建模结果。本研究将进一步扩大样品量,提高模型的稳健性与准确性。本研究结果可为近红外光谱技术在稻米镉快速识别上提供初步依据。

1 Chaney R L,Reeves P G,Ryan J A,et al.Improved understanding of hyperaccumulation yields commercial phytoextraction and phytomining technologies[J].Biometals,2004,17(5):549~553.

2 Lindén A,Olsson I M,Bensryd I,et al.Monitoring of cadmium in the chain from soil via crops and feed to pig blood and kidney[J].Ecotoxicology and Environmental Safety,2003,55(2):213~222.

3 Chen Gui-ping,Mei Yuan,Tao Wei,et al.Micro near infrared spectroscopy(MicroNIRS)based on on-line enrichment:determination of trace copper in water using glycidyl methacrylatebased monolithic material[J].Analytica Chimica Acta,2011,670(1~2):39~43.

4 Akamatsu S,Yoshioka N,Mitsuhashi T.Sensitive determination of cadmium in brown rice and spinach by flame atomic absorption spectrometry with solid-phase extraction[J].Food Additives &Contaminants:Part A,2012,29(11):1 696~1 700.

5 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using aportable near-infrared spectrometer[J].Analytical Science,2003,19(11):1 553~1 555.

6 González-Martín I,González-Pérez C,Hernández-Méndez J,et al.Mineral analysis(Fe,Zn,Ca,Na,K)of fresh Iberian pork loin by near infrared reflectance spectrometry:Determination of Fe,Na and K with a remote fibre-optic reflectance probe[J].Analytica Chimica Acta,2002,468(2):293~301.

7 Font R,Del Río-Celestino M,Vélez D,et al.Visible and nearinfrared spectroscopy as a technique for screening the inorganic arsenic content in the red crayfish(procambarus clarkii Girard)[J].Analytical Chemstry,2004,76(14):3 893~3 898.

8 Font R,Del Río-Celestino M,Vélez D,et al.Use of near-infrared spectroscopy for determining the total arsenic content in prostrate amaranth[J].Science of the Total Environment,2004,327(1~3):93~104.

9 Font R,Vélez D,Del Río-Celestino M,et al.Screening inorganic arsenic in rice by visible and near-infrared spectroscopy[J].Microchimica Acta,2005,151(3~4):231~239.

10 张龙,潘家荣,朱诚.基于近红外光谱的重金属汞、镉和铅污染水稻叶片鉴别[J].浙江大学学报(农业与生命科学版),2013,39(1):50~55.

11 刘燕德,施宇.香根草叶片铅含量近红外光谱快速检测[J].农业机械学报,2014,45(3):232~236.

12 Ning Yu,Li Ji-hui,Cai Wen-sheng,et al.Simultaneous determination of heavy metal ions in water using near-infrared spectroscopy with preconcentration by nano-hydroxyapatite[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2012(96):289~294.

13 Huang Zi-xia,Tao Wei,Fang Juan-juan,et al.Multivariate calibration of on-line enrichment near-infrared (NIR)spectra and determination of trace lead in water[J].Chemometrics and Intelligent Laboratory Systems,2009,98(2):195~200.

14 Kumagai M,Ohisa N,Amano T,et al.Canonical discriminant analysis of cadmium content levels in unpolished rice using a portable near-infrared spectrometer[J].Analytical Sciences,2003,19(11):1 553~1 555.

15 Norgaard L,Saudland A,Wagner J,et al.Interval partial least squares regression (iPLS):a comparative chemometric study with an example from near-infrared spectroscopy[J].Applied Spectroscopy,2000,54(3):413~419.

16 丁姣,蔡建荣,张海东,等.近红外结合Si-ELM检测食醋品质指标[J].食品与机械,2012,28(1):93~96.

17 Kennard R W,Stone L A.Computer aided design of experiments[J].Technometrics,1969(11):137~148.

18 陆婉珍.现代近红外光谱分析技术[M].第二版.北京:中国石化出版社,2006.

19 张菊华,朱向荣,苏东林,等.茶油品质鉴别的透射和透反射模式分析比较[J].食品与机械,2012,28(1):101~104.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!