时间:2024-05-21
汤菲菲 姚燕 邵玉涛
摘要:马克隆值是评价棉纤维品质的一个重要指标,提出一种基于Gaussian软件的波长筛选方法,以期提高红外光谱法测定棉纤维马克隆值的准确性。采用基于哈特里-福克方程(简称HF)的从头算计算法、半经验分子轨道AM1方法和密度泛函理论DFT对棉纤维分子进行量子化学计算,并将计算结果与棉纤维红外光谱图进行比较分析,从而得到最优理论计算方法及其基组,进而通过分析该最优理论红外光谱图得到特征波长。该方法筛选出的特征波长为3 727~3 567、3 005~2 700、1 250~1 000 cm-1。分别利用此特征波长与连续投影法(SPA)选出的特征波长建立偏最小二乘(PLS)模型,对比分析的结果表明,使用Gaussian软件DFT密度泛函理论的B3LYP/6-311+G* *方法可以较为准确地得到最优光谱图,该理论光谱波长筛选方法可以优选出高信噪比的波长。基于Gaussian软件的波长筛选方法能够简化红外建模步骤并提高红外光谱定量模型的性能。
关键词:棉花;纤维品质;纤维分子结构;马克隆值;Gaussian软件;量子化学;波长筛选;模型优化;效果验证
中图分类号: O657.33 文献标志码: A 文章编号:1002-1302(2019)07-0207-03
棉花是我国重要的战略物资,是仅次于粮食的第二大类农作物,在农业经济格局中具有重要地位。棉花质量的好坏对于其价格、生产工艺成本以及后续产品的质量起着至关重要的作用。马克隆值是反映棉花纤维细度与成熟度的综合指标,且会对成纱工艺、质量及织物质量产生很大的影响,是棉花贸易、棉纺工程的重要指标。
传统棉纤维马克隆值的测量需要借助Y145C型气流仪、便携式气流仪等仪器[1],这种检验方法不仅费时费力,而且由于个人经验的不同以及把握的标准不同,容易出现人为误差。红外光谱是现代结构化学和分析化学最常用和不可缺少的工具,具有测试迅速、操作方便、重复性好、灵敏度高、不损坏样本结构等优点,因此被广泛应用于科学研究的各个领域[2]。但红外光谱对于复杂对象待测组分的特征吸收频率会受到其他组分的干扰,得到的冗余信息较多,从而影响吸收峰位置、强度,甚至峰的形状,进而影响模型的预测精度。因此,进行光谱定量分析时,必须选择与待测组分相关的高信息量波长,以降低其他组分带来的噪声干扰[3]。Gaussian软件是一个成熟、界面友好的量子化学软件,可执行各类不同精度和理论档次的量化计算,并可进行分子和化学反应性质的理论预测。因此,可以利用Gaussian软件模拟红外光谱并在进行红外光谱试验之前筛选出特征波长,缩小可用的光谱区范围,节约试验时间,提高模型预测精度。
本研究提出在进行红外光谱试验之前利用Gaussian软件对理论模拟光谱进行波长筛选,在最优波段运用红外光谱测量马克隆值的方法,以期缩短红外光谱试验的时间,减少冗余光谱信息,提高预测模型的精度。采用3种方法对棉纤维分子进行量子化学计算,将计算结果与实际试验光谱图进行对比分析,从而得到最优的理论计算方法及其基组,并得到与实际试验较为吻合的理论红外光谱图,通过分析该理论红外光谱图进一步得到棉纤维分子的频带分配信息,进而由频带分配信息得出特征波长;分别将该特征波长与连续投影法(SPA)选择的特征波长建立偏最小二乘(PLS)模型,并对模型优化效果进行验证。
1 红外吸收光谱原理解析
红外吸收光谱是由分子振动、转动能级的跃迁所形成的[4]。在有机分子中,不同基团选择性地吸收不同频率的红外辐射,引起分子的能量变化,发生不同振动能级的跃迁,形成独特的红外吸收光谱。绝大多数有机化合物和无机离子的基频吸收带出现在中红外光谱区,由于基频振动是红外光谱中吸收最强的振动,因此该区被广泛应用于化合物分析、结构分析和其他化学过程的定性定量分析中[5]。本研究对棉纤维结构以及内部分子振动的分析也在中红外区域进行。
2 Gaussian软件的使用
Gaussian软件作为强大的工具,可以研究许多化学领域的课题,也正是因为该软件在计算分子振动频率方面具有较高的精度,本研究采用该软件对棉纤维分子进行结构优化和红外振动光谱的模拟计算。整个计算过程为利用GaussView 5.0、Chemdraw/Chem 3D、Hyperchem等绘图软件绘制输入文件[6],选择合适的基组对该文件进行几何优化,几何优化的目的是寻找分子稳定的几何形态,即将建立的模型优化到一个能量极小的点上[7];然后使用相同的基组选择合适的方法进行频率计算[8],并通过GaussView 5.0显示计算结果。
整个理论计算过程如图1所示,通过该过程能够在理论上得到较为准确的分子理论振动谱。
3 棉纤维的红外光谱理论解析
3.1 基组的选择
采用GaussView 5.0软件绘制棉纤维分子结构图,并分别采用哈特里-福克方程(HF)从头算理论、AM1半经验理论和DFT密度泛函理论对棉纤维分子进行量子化学计算[7]。每种理论计算方法的几何优化和频率计算均在相同的理论水平和基组上完成,HF方法选择的基组是HF/6-31G(d),DFT方法选取的基组为B3LYP/6-311+G(d,p),一般表示为B3LYP/6-311+G* *[9]。计算结果没有虚频出现,说明得到的分子结构是一个稳定的构象。棉纤维分子结构如图2所示。
吸光度分别采用HF、AM1、DFT方法算出的结果,EXP代表的是试验光谱,根据式(1)、式(2)可得到理论计算光譜。图3代表的是在红外光谱指纹区(1 330~400 cm-1)使用3种不同方法计算出的结果以及实际试验得到的棉纤维吸光度信息,图4代表的是在红外光谱特征区(4 000~1 330 cm-1)使用3种不同方法计算出的结果以及实际试验得到的棉纤维吸光度信息。
由图3、图4可知,利用DFT密度泛函理论的B3LYP/6-311+G* *方法所得到的计算结果在吸收峰数量、波形形状以及频率位置、吸光度上与试验吸收峰最为接近,而HF、AM1方法得到的吸收谱与试验结果相差较大,这可能与理论本身精度不够或选取的基组偏小有关。相对于HF和AM1方法,DFT采用了B3LYP/6-311+G* *较大基组,并有效地考虑了电子交换和电子相关能量,因而有较高的计算正确率。
3.2 基于最优光谱图的特征波长筛选
从图5、图6可以看出,Gaussian软件鉴定基团的结果与理论结果是很符合的,且理论光谱(DFT)与试验光谱的变化趋势大体相同,只是存在一定程度的偏移,主要原因为(1)试验是在常温下进行的,而理论计算在绝对零度的条件下进行,随着温度的升高,棉纤维的吸收峰强度也会增强[11];(2)理论计算时采用的是单分子模型,只能得到分子内的振动模式,而忽略了分子之间的范德华力、氢键弱作用力以及晶格振动等。因此,理论计算结果与试验结果不可能完全相符,但可从另一角度验证吸收峰来源判断的正确性。
纤维素大分子的官能团主要是羟基(—OH)、亚甲基(—CH2)和醚键[R—O—R(R′)]。从图5、图6可以看出,在4 000~400 cm-1范围内,棉纤维最强的红外吸收带在1 060 cm-1 附近,在其两侧有很多弱的肩峰,在2 855、2 932、3 647 cm-1处也有较强的红外吸收带。根据红外光谱基团吸收带的数据可知,一般情况下,羟基、亚甲基、醚键的实际吸收带分别为 3 630、2 900、1 100 cm-1左右。结合基团吸收频率与分子振动之间的关系,可以得出棉纤维分子的频带分配结果(表1)。根据吸光度波长筛选方法[12]可得到,选取的特征波段为 3 727~3 567、3 005~2 700、1 250~1 000 cm-1,波长点个数为715个。
3.3 特征波长筛选方法有效性检验
连续投影算法(SPA)是一种使矢量空间共线性最小化的前向变量选择算法,其优势在于提取全波段的几个特征波长,能够消除原始光谱矩阵中冗余的信息,可用于光谱特征波长的筛选。近年来,国内外学者在利用光谱分析技术检测作物和食品中某些重要成分的含量时,采用连续投影算法进行有效波长的选取[13]。作为对比,本研究采用连续投影算法提取特征波长,分别建立偏最小二乘模型,以验证基于Gaussian软件波长筛选方法的有效性。试验收集了30个棉纤维样本,随机选择25个样本为训练集,5个为测试集,采用大容量棉花纤维测试仪(HVI)[14]测得棉纤维样本的马克隆值,并使用美国Thermo Fisher Scientific公司生产的Nicolet系列NEXUS670型号的傅里叶变换红外光谱仪测量30个样本的红外吸收光谱。红外试验在室温(20~23 ℃)环境下进行,光谱仪的扫描方式为漫反射方式,分辨率为8 cm-1,自动扫描32次,记录其平均光谱。
对试验数据分别进行偏最小二乘回归,由结果(图7)可知,SPA算法优选的波长为13个,此时的预测平均标准偏差(RMSE)最小,为0.16,2种不同波长筛选方法得到的预测结果对比如表2所示。SPA方法提取出了13个特征波段,分别为1 060、1 087、1 248、2 757、2 790、2 855、2 932、2 853、3 002、3 621、3 647、3 696、3 705 cm-1,它们均分布在本研究方法筛选出的特征波段中,由表2可知,采用SPA方法预测相关系数达到0.825,表明该算法确实提取了建模所需要的有用信息,简化了模型的计算,但是与之相比,本研究提出的波长筛选方法建立的模型预测精度更高。
4 结论
本研究提出一种基于理论吸收光谱筛选出最优波长并测定马克隆值的新方法,该方法利用Gaussian软件采用DFT密度泛函理论的B3LYP/6-311+G* *基组得到最优光谱图,分别将该方法筛选出的特征波长与SPA法得到的特征波长建立PLS模型,通过比较相关系数以及均方根误差可知,该方法能够有效地筛选出有用的特征波长信息,且选择效果优于经典的连续投影法。通过理论模拟红外吸收光谱进行波长筛选,并在筛选出的波长范围内进行后续的红外光谱试验,可简化建模计算,提高棉纤维马克隆值的预测精度。
参考文献:
[1]孟莉莉. 棉花检验中的马克隆值测试方法[J]. 中国纤检,2014(7):78-79.
[2]杨新河,王丽丽,黄建安,等. 傅里叶变换红外光谱鉴别黑茶样品[J]. 食品科学,2012,33(14):203-205.
[3]陈艺芳. 可见-近红外-中红外光谱用于人血清白蛋白分析的方法研究[D]. 广州:暨南大学,2016.
[4]黄 莉. 红外光谱结合模式识别技术在微量车漆物证分析中的应用[J]. 法制与社会,2016(35):273,277.
[5]岳飞亨. 基于太赫兹波的持久性有机物检测技术研究[D]. 杭州:浙江大学,2012.
[6]颜志刚. 基于太赫兹时域光谱技术的生物分子和农药分子的检测技术研究[D]. 杭州:浙江大学,2008.
[7]Yu W,Yang L,Zhang T L,et al. Crystal structure and geometry-optimization study of 4-methyl-3′,5′-dinitor-4′-methyl benzylidene aniline[J]. Journal of Molecular Structure,2006,794(1/2/3):255-260.
[8]胡皆汉,叶金星,程国宝,等. β-榄香烯振动光谱的量子化学从头计算[J]. 光谱学与光谱分析,2001,21(2):163-168.
[9]Fischer B M,Walther M,Uhd Jepsen P. Far-infrared vibrational modes of DNA components studied by terahertz time-domain spectroscopy[J]. Physics in Medicine and Biology,2002,47(21):3807-3814.
[10]Yu B,Zeng F,Yang Y,et al. Torsional vibrational modes of tryptophan studied by terahertz time-domain spectroscopy[J]. Biophysical Journal,2004,86(3):1649-1654.
[11]赵永会,顾丹丹,冯俊霞,等. 二维红外光谱法分析纤维素[J]. 理化检验(化学分册),2015,51(11):1497-1500.
[12]梁 瑜. 基于吸光度的波长筛选方法用于近红外光谱定量模型的优化[J]. 电子测试,2016(21):62-64.
[13]刘明博,唐延林,李晓利,等. 水稻叶片氮含量光谱监测中使用连续投影算法的可行性[J]. 紅外与激光工程,2014,43(4):1265-1271.
[14]马浩彩,郝秀美. 使用美棉纺细号纱棉结的控制[J]. 棉纺织技术,2011,39(3):142-144.程 欣,林 立,林乐静,等. 4种槭树种子油脂肪酸组成及含量比较[J]. 江苏农业科学,2019,47(7):220-224.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!