时间:2024-09-03
朱红求,陈俊名,尹冬航,李勇刚,阳春华
一种基于紫外可见光谱的多金属离子浓度检测方法
朱红求,陈俊名,尹冬航,李勇刚,阳春华
(中南大学信息科学与工程学院,湖南长沙 410083)
针对Cu2+,Co2+,Zn2+3种金属离子混合溶液的紫外可见分光光度法(UV-Vis)光谱重叠而难以检测的问题,提出了一种基于改进型Monte Carle无信息变量消除(MC-UVE)方法的多金属离子浓度检测方法。在MC-UVE的基础上引入指数衰减函数(EDF),提出了一种改进的MC-UVE方法,并基于该方法对料液的紫外-可见光谱进行波长筛选;然后,利用筛选出的波长建立PLS模型并进行各组分浓度检测计算;最后,分别对基于MC-UVE方法和改进型MC-UVE方法PLS模型的计算结果进行对比分析。结果表明:改进型MC-UVE方法可筛选出对模型贡献度高的变量,基于该变量选择方法的PLS模型精度高。
紫外可见光谱;Monte Carle无信息变量消除;变量筛选;重叠光谱分离;偏最小二乘法;光化学;计算化学
在冶金工业,水质监测等过程中,多金属离子浓度检测是重要的环节[1-2],常用的金属离子检测方法有:原子吸收光谱法[3-4]、液相色谱分析法[5]、电感耦合等离子体质谱法[6-7]、紫外可见分光光度法[8-10]等。综合考虑被测离子的种类和浓度范围,以及检测精度和速度等要求,本文选择操作简单、准确度高、重现性好的紫外可见分光光度法(UV-Vis)作为基本的检测方法[11]。但传统UV-Vis检测主要面向单离子,应用于多金属离子时,需要对各组分离子进行化学方法预分离,步骤烦琐,实时性差[12]。近年来,随着化学计量学的不断发展,基于多元分析方法[如偏最小二乘法(PLS)[13]、主成分分析方法(PCR)[14]等]处理多金属离子的混合光谱,可实现复杂混合样品中多金属离子浓度同时检测[15]。然而,当各金属离子吸收光谱互相干扰和重叠严重时,传统的多元分析方法以全光谱信息为变量进行建模,存在较大的误差和大量冗余信息,模型精度较低且实时性差。因此,需要筛选出信息量较大的波长作为变量进行建模。
目前,国内外学者对有效波长变量筛选方法进行了相关研究,常用的特征变量选择方法主要有:间隔偏最小二乘法(iPLS)[16]、联合区间偏最小二乘法(siPLS)[17-18]、无信息变量消除方法[19-21]、Monte Carle无信息变量消除方法(MC-UVE)[22-24]、竞争性自适应加权算法(CARS)[25-28]等。前两者主要对光谱区间进行选择,并未有针对性地选取特征变量,而MC-UVE和CARS方法则能筛选出对建模贡献度高且误差较小的变量。但通过分析发现,MC-UVE法主要用于剔除光谱中的噪声波长点,但在去除贡献度低的非噪声点时存在较大局限性[29];CARS方法是近年来新提出的一种变量筛选理论,该方法在对无效变量进行去除的同时还尽可能减少了共线性变量对模型的影响,但由于Monte Carle采样选择样本不同,所以回归系数一直在变化,其大小并不能完全反映变量的重要性[30]。
为了进一步提高模型精度,本文提出一种将MC-UVE方法与指数衰减函数(EDF)相结合的改进型算法。首先应用UV-Vis获取Cu2+、Co2+、Zn2+3种不同浓度离子的混合吸光度;其次,基于Monte Carle方法(MC)对其进行采样,用于提高变量对混合吸光度的确定度,并使用指数衰减函数EDF对变量进行初选;然后,应用UVE方法选择混合吸光度中的有效波长点,并基于PLS法建立浓度与混合吸光度之间的回归模型;最后,通过建立的模型对混合吸光度进行分离计算得到各个离子的浓度值。
1.1 UV-Vis分析原理
UV-Vis是基于比尔-朗伯(Beer-Lambert,BL)定理的一种分析方法,原理如式(1)所示
=C(1)
其中,为吸光度,为摩尔吸光系数,为物质浓度。当单一样本中有个组分在个波长点上测量时,则有
将以上方程组写成矩阵方程
×1=×n×1(3)
当有个样本混合溶液在个波长点测量时,式(3)变为
×m=×n×m(4)
由式(4)可知,当吸光系数矩阵n已知时,通过获取光谱矩阵×m就可求解出浓度×m。在求解已知组分时有以下两种情况。
(1)当选择波长数和样品组分数相等时,此时吸收系数矩阵为方阵,可直接求逆如
此方法虽然简单,但考虑到测量存在操作误差,如果某一波长位置选择不当,测定误差将会很大。
(2)当选择的波长数大于组分数,即>时,方程个数多于未知组分数,便组成超定方程,由于n不是方阵,对式(4)进行如式(6)所示的变换,得到
(7)
式(7)求解需要两次求逆变换,进行了大量的舍入,计算精确性较低。
1.2 偏最小二乘法
偏最小二乘法(PLS)是多组分浓度分析中重要的多元线性回归方法。与1.1节介绍的方法不同的是,PLS方法不再需要进行求逆的运算,而是将吸收定律变形,用浓度矩阵作为吸光度的函数,具体求解过程如下:将吸光度矩阵与浓度矩阵分别进行分解得到式(8)和式(9)。
=(8)
=(9)
其中,和为与的装载矩阵,即特征向量矩阵;和为与的得分矩阵,即原矩阵在装载矩阵上的投影。由于在Beer-Lambert定理中与呈线性关系,因此,设与满足式(10)
=(10)
由式(8)可计算得
T=T=(11)
再由式(9)、式(10)和式(11)可得
==T(12)
由式(12)可知,求解出、和值,即可求得与的关系式。
然而,运用PLS方法对光谱矩阵和浓度矩阵建模时,由于无法确认合适的测定波长位置,所以通常使用全光谱数据建模。全光谱虽然包含全部信息,但其中也夹杂了实验误差、贡献度低的冗余信息,导致建模分析的结果精度较低,因此,需要在全光谱中筛选贡献度高的波长点。
1.3 改进型MC-UVE方法
MC-UVE是一种基于PLS回归系数的变量选取方法,变量的重要性指标为式(13)
式中,b表示第个变量的回归系数,me为回归系数的平均值,为回归系数的标准差。将光谱矩阵×m转置变换为自变量×l;浓度矩阵×m转置变换为因变量×n。MC-UVE算法首先通过Monte Carle方法对×l进行次随机采样,然后将个子集与×n进行PLS回归分析,得到回归系数矩阵b,其中=1,2,…,即个混合样品;=1,2,…,即个波长点。其次,按式(13)计算个波长变量的重要性指标。最后,把个变量按照重要性指标绝对值从大到小的顺序排列,定义一个阈值,小于该阈值的作为无信息变量剔除,该阈值由未知样品检测结果来确定:把波长变量按稳定性从大到小累积依次进行PLS建模,通过检测集分别计算检测结果。在所有结果中选择预测误差均方根(RMSEP)最小时所对应的变量集即为最终选择的变量,而该最优变量集中最后加进来的重要性指标即为阈值。
MC-UVE方法虽然能快速去除夹杂噪声的变量,但却保留了大量对模型贡献度不高的非噪声变量,这主要是因为Monte Carle算法在对样本抽取的过程中随机性较大,导致变量稳定性指标计算不准确。通常需要大幅度增加采样次数提高准确度,这使得计算过程耗时较长。实验表明,面对同一批样品,每次计算出的变量稳定性有所差别,又因为在之后的变量选取过程中,UVE算法采取的是直接去除RMSEP达到最小之后的变量,因此容易遗漏因稳定性分析不准确而指标较低的有效波长变量,从而导致算法的准确度降低。
综合以上问题,本文采用多重循环的Monte Carle采样方式以规避采样过程的偏差,为加快变量筛选过程的速度,引入指数衰减函数(EDF)快速淘汰稳定性指标过低的无用波长变量,提出一种复合型变量筛选方法,具体算法如下:
(1)设置个循环,每一次循环之前通过Monte Carle方法对样品随机采样,按照的采样比例,采样次数为。采样后采用式(13)计算每个变量的重要性。当1时,计算原始变量的稳定性值。
(2)通过指数衰减函数(EDF)对变量进行初步筛选,指数衰减函数可以强行保留稳定性值较大的变量,变量保留率按式(14)计算
r=e-ki(14)
其中,和为第1次和第次循环时样本集中建模数目,为遍历所有变量,第次设为2个变量,所以1=;r=,从而可计算得,其中为原始变量数,为设定的总循环次数。
(3)将初选后的变量按照重要性从高到低排列,再运用UVE方法对数据进一步筛选,通过PLS建模后得出RMSEP最小的变量子集SET,进行下一步循环。
(4)当循环次数达到指定值时,循环结束,比较个变量子集,其中RMSEP值最小的子集即为最优子集。变量筛选过程完成。
2.1 实验设计
仪器选用北京普析T9紫外可见分光光度仪。显色剂选用2-(5-溴-2-吡啶偶氮)-5-二乙氨基苯酚(5-Br-PADAP)溶液:0.2 g·L-1乙醇溶液;Cu2+、Zn2+、Co2+标准液:1.0 g·L-1;增敏剂选用溴化十六烷基三甲基铵(CTMAB)溶液:1.00×10-3mol·L-1;缓冲液选用pH 8.3的硼砂-盐酸缓冲溶液。以上所用试剂均为分析纯。
按实验要求移取一定量上述Cu2+、Zn2+、Co2+3种标准溶液于25 ml容量瓶中,并加入5.0 ml 0.2 g·L-15-Br-PADAP乙醇溶液、4.0 ml 1.00×10-3mol·L-1CTMAB溶液;6.0 ml pH =8.3硼砂-盐酸缓冲溶液,以水定容。以试剂空白作参比,在400~700 nm波长范围内,间隔0.5 nm测量各点的吸光度。
Zn2+、Cu2+、Co2+3种离子在浓度同为0.3 mg·L-1时的混合光谱如图1所示,可知,Zn2+、Cu2+两种离子最大吸收波长相近,谱图重叠严重,而Co2+在混合光谱中信息保留较好。
在3种离子的标准液中稀释出10种不同浓度的溶液,浓度范围为0.1~1.0 mg·L-1。为提高实验效率,本文采用均匀设计的实验设计方法,按照此实验设计方案需进行40组混合样品实验。分析在各个组分浓度时光谱重叠情况,选择波长范围为400~700 nm,如图2所示。
2.2 波长选择
通过改进型MC-UVE的方法对Cu2+、Co2+和Zn2+3种离子的全光谱数据601个波长变量(400~700 nm,分辨率为0.5 nm)进行选择,方法如1.3节所介绍,按照采样率为60%对校正集样本进行随机采样,一共采样=80次,循环次数为=20次,EDF函数中,因为变量总数为601,经计算可得常数=1.35,=0.3。图3(a)~(f)分别为3种离子在此方法下随着循环次数的增加,变量筛选情况及模型的RMSEP变化情况。其中图3(a)~(c)中横坐标为改进型MC-UVE方法的循环次数,蓝色曲线表示随着循环次数的增加,变量数的变化情况,绿色曲线为每一次循环后剩余变量建模的模型RMSEP值变化情况。
总体分析图3可知,变量筛选过程呈现出一个先快后慢的过程,这主要是因为EDF函数在前期强制剔除了大量稳定性指标较低的波长变量。当RMSEP值达到最低之后,随着循环的继续,RMSEP值快速提升,这是由于此时EDF函数的强制筛选功能开始剔除对模型重要的变量,从而影响了模型检测精度。图3(a)为Cu2+的变量筛选情况,在=9时,其RMSEP值达到最低,此时得到的就是模型最优子集,共32个变量,类似的图3(b)、(c) 分别为Zn2+、Co2+的变量筛选结果,分别得到39和48个变量。图3(d)、(e)、(f)显示了改进型MC-UVE方法分别为Cu2+、Co2+、Zn2+3种离子选择的变量的结果,其中垂直竖线即为选取的波长点,从选择波长点的位置发现,除了选择最大吸收波长外,该方法也会从单组分中较为突出的独立特征吸收峰进行选择。而600~700 nm区间,由于对PLS模型贡献率低,所以并没有在此区间选取变量。
2.3 PLS建模及检测结果分析
在进行了波长的选择之后,使用筛选后的变量PLS建模,并配制20组浓度均匀分布在0.1~1 mg·L-1的混合样本作为检测样本集进行验证,比较基于MC-UVE变量筛选的PLS建模和基于改进型MC-UVE方法的PLS建模获得的结果,表1中可以看出两个模型都筛选出了对模型有贡献的变量,而改进型MC-UVE方法筛选出的变量更少,同时RMSEP与相对误差更低,显然,改进后的算法模型取得了更优的检测结果。图4为改进型MC-UVE方法PLS模型对3种离子检测集样本的检测值和实际值之间的散点图,由图4可知此方法检测精度较高,效果较理想。
表1 MC-UVE与改进型MC-UVE方法的PLS建模比较
本文主要探讨多种金属离子难以同时准确检测的问题,分析了Cu2+、Co2+、Zn2+3种金属离子在以2-(5-溴-2-吡啶偶氮)-5-二乙氨基苯酚(5-Br-PADAP)为核心的化学体系中的紫外可见光谱。针对各组分光谱重叠难以解析分离的问题,提出一种改进型MC-UVE方法对光谱数据进行前处理,获取对PLS模型贡献率高且稳定的变量,再结合PLS方法建模的多金属离子浓度检测方法。采用实验数据对该方法与基于MC-UVE的方法进行了比较分析,结果表明:此方法与使用MC-UVE方法进行前处理相比,取得了更优的检测结果,妥善处理了多组分金属离子紫外重叠光谱解析分离的问题。
[1] WANG G W, YANG C H, LI Y G,. State-transition-algorithm-based resolution for overlapping linear sweep voltammetric peaks with high signal ratio[J]. Chemometrics and Intelligent Laboratory Systems, 2016, 151: 61-70.
[2] 邓仕钧, 阳春华, 李勇刚, 等. 锌电解全流程酸锌离子浓度在线预测模型[J]. 化工学报, 2015, 66(7): 2588-2594. DENG S J, YANG C H, LI Y G,. On-line prediction model for concentrations of zinc ion and sulfuric acid in zinc electrowinning process [J]. CIESC Journal, 2015, 66(7): 2588-2594.
[3] ANTHEMIDIS A N, ZACHARIADIS G A, STRATIS J A. Determination of arsenic(III) and total inorganic arsenic in water samples using an on-line sequential insertion system and hydride generation atomic absorption spectrometry[J]. Analytica Chimica Acta, 2005, 547(2): 237-242.
[4] CARLETTO J S, ROUX K C D P, MALTEZ H F,. Use of 8-hydroxyquinoline-chitosan chelating resin in an automated on-line preconcentration system for determination of zinc(Ⅱ) by F AAS[J]. Journal of Hazardous Materials, 2008, 157(1): 88-93.
[5] HU Q F, YANG G Y, ZHAO Y Y,. Determination of copper, nickel, cobalt, silver, lead, cadmium, and mercury ions in water by solid-phase extraction and the RP-HPLC with UV-Vis detection[J]. Anal. Bioanal. Chem., 2003, 375(6): 831-835.
[6] AMMANN A A. Speciation of heavy metals in environmental water by ion chromatography coupled to ICP-MS[J]. Anal. Bioanal. Chem., 2001, 372(3): 448-452.
[7] DEITRICH C L, CUELLO-NUÑEZ S, KMIOTEK D,. Accurate quantification of selenoprotein P (SEPP1) in plasma using isotopically enriched seleno-peptides and species-specific isotope dilution with HPLC coupled to ICP-MS/MS[J]. Anal. Chem., 2016, 88(12): 6357-6365.
[8] ŞAHIN S, DEMIR C, GÜÇER Ş. Simultaneous UV-vis spectrophotometric determination of disperse dyes in textile wastewater by partial least squares and principal component regression[J]. Dyes and Pigments, 2007, 73(3): 368-376.
[9] 张宇博, 张威, 车得福. 利用分光光度法测定混合电解质溶液中铁氰化钾的浓度[J]. 化工学报, 2013, 64(4): 1226-1230. ZHANG Y B, ZHANG W, CHE D F. Measurement of potassium ferricyanide concentration in electrolyte solution using UV-VIS spectrophotometry[J]. CIESC Journal, 2013, 64(4): 1226-1230.
[10] 彭雄威. 多金属离子极谱重叠峰在线分离方法研究与应用[D]. 长沙: 中南大学, 2014. PENG X W. On-line resolution for overlapped polarographic peaks of polymetallic ion and its application[D]. Changsha: Central South University, 2014.
[11] 汤斌, 魏彪, 毛本将, 等. 紫外-可见吸收光谱法水质检测系统的噪声分析与处理研究[J]. 激光与光电子学进展, 2014, (4): 201-207. TANG B, WEI B, MAO B J,. Noise analysis and denoising research on the UV-visible absorption spectroscopy water quality detection system[J]. Laser & Optoelectronics Progress, 2014, (4): 201-207.
[12] ZHU H Q, WANG G W, YANG C H,. Overlapped peaks resolution for linear sweep polarography using Gaussian-like distribution[J].Transactions of Nonferrous Metals Society of China, 2013, 23(7): 2181-2186.
[13] HÖSKULDSSON A. PLS regression methods[J]. Chemometrics, 1988, 2(3): 211-228.
[14] GHASEMI J, NIAZI A. Simultaneous determination of cobalt and nickel. Comparison of prediction ability of PCR and PLS using original, first and second derivative spectra[J]. Microchemical Journal, 2001, 68(1): 1-11.
[15] LI H D, LIANG Y Z, XU Q S. Uncover the path from PCR to PLSelastic component regression[J]. Chemometrics and Intelligent Laboratory Systems, 2010, 104(2): 341-346
[16] NORGAARD L, SAUDLAND A, WAGNER J,. Interval partial least-squares regression (iPLS): a comparative chemometric study with an example from near-infrared spectroscopy[J]. Appl. Spectrosc., 2000, 54(3): 413-419.
[17] 李倩倩. 无信息变量消除法在三种谱学方法中的定量分析研究[D].北京: 中国农业大学, 2014. LI Q Q. Uninformative variable elimination combined with three spectroscopy methods for quantitive analysis[D]. Beijing: China Agricultural University, 2014.
[18] FERRÃO M F F, VIERA M D S, PAZOS R E P,Simultaneous determination of quality parameters of biodiesel/diesel blends using HATR-FTIR spectra and PLS, iPLS or siPLS regressions[J]. Fuel, 2011, 90(2): 701-706.
[19] CENTNER V, MASSART D L, DE NOORD O E,Elimination of uninformative variables for multivariate calibration[J]. Anal. Chem., 1996, 68(21): 3851-3858.
[20] WU D, CHEN X J, SHI P Y,. Determination of α-linolenic acid and linoleic acid in edible oils using near-infrared spectroscopy improved by wavelet transform and uninformative variable elimination[J]. Analytica Chimica Acta, 2009, 634(2): 166-171.
[21] KOSHOUBU J, IWATA T, MINAMI S. Elimination of the uninformative calibration sample subset in the modified UVE(uninformative variable elimination)-PLS (partial least squares) method[J]. Analytical Sciences, 2001, 17(2): 319-322.
[22] 郝勇, 孙旭东, 潘圆媛, 等. 蒙特卡罗无信息变量消除方法用于近红外光谱预测果品硬度和表面色泽的研究[J]. 光谱学与光谱分析, 2011, (5): 1225-1229. HAO Y, SUN X D, PAN Y Y,. Detection of firmness and surface color of pear by near infrared spectroscopy based on Monte Carlo uninformative variables elimination method[J]. Spectroscopy and Spectral Analysis, 2011, (5): 1225-1229.
[23] CAI W S, LI Y K, SHAO X G. A variable selection method based on uninformative variable elimination for multivariate calibration of near-infrared spectra[J]. Chemometrics and Intelligent Laboratory Systems, 2008, 90(2): 188-194.
[24] HAN Q J, WU H L, CAI C B,. An ensemble of Monte Carlo uninformative variable elimination for wavelength selection[J]. Analytica Chimica Acta, 2008, 612(2): 121–125.
[25] XU D, FAN W, LV H Y,Simultaneous determination of traces amounts of cadmium, zinc, and cobalt based on UV-Vis spectrometry combined with wavelength selection and partial least squares regression[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2014, 123: 430-435.
[26] LI H D, LIANG Y Z, XU Q S,. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.
[27] TAN B B, LIANG Y Z, YI L Z,. Identification of free fatty acids profiling of type 2 diabetes mellitus and exploring possible biomarkers by GC-MS coupled with chemometrics[J]. Metabolomics, 2009, 6(2): 219-228.
[28] WU D, SUN D W. Application of visible and near infrared hyperspectral imaging for non-invasively measuring distribution of water-holding capacity in salmon flesh[J]. Talanta, 2013, 116: 266-276.
[29] 李江波, 郭志明, 黄文倩, 等. 应用CARS和SPA算法对草莓SSC含量NIR光谱预测模型中变量及样本筛选[J]. 光谱学与光谱分析, 2015, (2): 372-378. LI J B, GUO Z M, HUANG W Q,. Near-infrared spectra combining with CARS and SPA algorithms to screen the variables and samples for quantitatively determining the soluble solids content in strawberry[J]. Spectroscopy and Spectral Analysis, 2015, (2): 372-378.
[30] 刘国海, 夏荣盛, 江辉, 等. 一种基于SCARS策略的近红外特征波长选择方法及其应用[J]. 光谱学与光谱分析, 2014, (8): 2094-2097. LIU G H, XIA R S, JIANG H,. A wavelength selection approach of near infrared spectra based on SCARS strategy and its application[J]. Spectroscopy and Spectral Analysis, 2014, (8): 2094-2097.
A UV-Vis analytical method for polymetallic solutions
ZHU Hongqiu, CHEN Junming, YIN Donghang, LI Yonggang, YANG Chunhua
(School of Information Science & Engineering, Central South University, Changsha 410083, Hunan, China)
A polymetallic analytical method based on an improved Monte Carlo uninformative variable elimination (MC-UVE) was proposed to determine ion concentration by ultraviolet visible (UV-Vis) spectra of Cu2+, Co2+and Zn2+mixture solution. The improved MC-UVE, developed by incorporating exponential attenuation function (EDF), was applied to selecting wavelength of UV-Vis spectra. And the partial least squares calibration model was built on concentrations of polymetallic components at the selected wavelength. Experimental results showed that the improved MC-UVE could select higher contributing model variables anddevelop more precise PLS model than MC-UVE.
UV-Vis spectrometry;MC-UVE;wavelength selection;overlapping spectral separation;PLS; photochemistry; computational chemistry
10.11949/j.issn.0438-1157.20161709
O 657.32
A
0438—1157(2017)03—0998—07
国家自然科学基金重点项目(61533021);国家创新研究群体科学基金项目(61621062)。
2016-12-05收到初稿,2016-12-12收到修改稿。
联系人:陈俊名。第一作者:朱红求(1970—),男,博士,副教授。
2016-12-05.
CHEN Junming, cjmrise@outlook.com
supported by the State Key Program of National Natural Science Foundation of China (61533021) and the Foundation for Innovative Research Groups of National Natural Science Foundation of China(61621062).
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!