当前位置:首页 期刊杂志

基于基团贡献的气体绝缘强度预测模型

时间:2024-07-28

张绍立,赵秋琳,王 璁,邱馨仪,曹人杰,郑 重,屠幼萍

(华北电力大学 高电压与电磁兼容北京市重点实验室,北京102206)

0 引言

由于SF6有很强的温室效应[1-3],自20 世纪80 年代以来,许多学者逐步开始探索可用于替代SF6的绝缘气体[4-5]。正确预测候选绝缘气体的绝缘强度是寻找替代气体的关键步骤,通过定量构效关系(quantitative structure-property relationship,QSPR)模型可以建立相应的气体分子描述符-绝缘强度定量构效关系模型,用来预测其他类型气体分子的绝缘强度,提高绝缘气体的筛选效率和设计效率,因此,该模型逐渐引起了研究者们的关注[6-8]。

国内外学者已经基于多种化学模拟方法研究了影响气体分子绝缘强度的微观因素[9-16]。在构建的气体绝缘强度QSPR 模型中,使用的分子结构相关参数主要有极化率、电子亲合能、偶极矩、电离能、吸收强度和分子轨道能隙等,参数值通常采用量子化学方法计算得到。然而,量子化学方法计算过程非常复杂,计算量非常庞大,当不采取量化参数分子描述符去表征分子之间的差异时,分子与分子之间最直观的区别是其组成基团类型或基团个数不同。虽然以往的气体绝缘强度QSPR 模型能很好地预测气体分子的绝缘强度,但是对分子描述符进行量化计算是相当抽象的,并且只凭借绝缘气体分子的量化计算数值并不能筛选出对分子绝缘强度影响较大的基团。

本文首次将气体分子绝缘强度和分子拓扑指数建立联系,以得到显著影响气体分子绝缘强度的基团及其影响程度。首先,基于密度泛函理论(density functional theory,DFT)对47 种绝缘气体的分子结构进行优化计算,其次,采用电性拓扑状态指数作为绝缘气体分子基团的量化指标,建立基团与气体绝缘强度的关系,并且采用逐步多元回归法,筛选出气体分子中对绝缘强度贡献度较大的基团,以期为现有绝缘气体遴选及新型绝缘气体分子的设计提供理论支撑。

1 原理与方法

1.1 分子拓扑指数原理

分子层面的分子描述符不能甄别气体分子中的基团,而分子拓扑指数是一种对化合物分子结构的数学描述,通过计算分子拓扑指数不仅可以直观便捷地对绝缘气体分子的基团进行定量表征,而且基于分子拓扑指数所表示的拓扑信息,可以计算和分析对分子性质参数产生显著影响的特定基团及其影响程度。

从1947年第一个分子拓扑指数出现至今,已经陆续提出了百余种分子拓扑指数,不同的分子拓扑指数可用于表征不同分子的结构信息,进而反映分子中的基团类型、分支数以及分子形状等拓扑信息。由于不同分子拓扑指数的适用范围存在差异,为了量化绝缘气体分子内部具体组成结构,进而基于基团贡献计算影响气体绝缘强度的特征基团,就必须先从多种类分子拓扑指数中选出反映各绝缘气体分子的拓扑信息。可应用于计算过程的目标分子拓扑指数需具备如下特点:①对样本内全部绝缘气体分子均有效;②可以充分表征绝缘气体分子自身的立体结构与拓扑环境等性质;③能对不同基团进行明显地区分和表征,也就是对于不同结构存在唯一性;④和绝缘强度相关性好。

特点①~③由分子描述符适用范围与计算原理决定,而特点④则需对气体绝缘强度和分子拓扑指数进行相关性计算分析,也就是采用多种数学统计指标去判断二者的相关性是否良好。

计算分子拓扑指数的一般程序为:首先把分子结构进行图形化处理,再把图形数值化处理为矩阵。计算化学领域常用的分子拓扑指数包括分子连接指数(molecular connectivity index,MIC)、Kappa 指数、Wiener 指数以及电性拓扑状态指数(electrotopological state indices,ETSI)等。MIC只能反映分子尺寸和分子之间的联系,不能表征原子价态、拓扑环境和电性等信息。而Kappa指数只能用来刻画分子柔性与形状,不能满足分子拓扑指数特性。Wiener 指数通过图形化分子结构再写距离矩阵来计算,虽然能实现分子结构的数字化,但它仅能区分分子类型,无法判断分子中所含基团的类型,也就是不能对基团进行数字化表示。其他相似条件下分子拓扑指数也较多,而电性拓扑状态指数能够充分表征化合物分子本身的立体结构、取代基、电性效应影响等性质,它能更好地描述分子中原子或基团之间的相互作用及其影响。经过以上分析,本文采用电性拓扑状态指数来表征各绝缘气体分子拓扑结构。

1.2 电性拓扑状态指数计算方法

使用分子轨道理论对分子中的电子排布进行分析时,分析的是整个分子空间内电子的状态变化。每个原子在分子中都会受到分子内部其他原子的扰动,因此当原子在构成分子时,分子整体的轨道及能级由隶属于某一个原子的电子同其他的微观粒子一起构成。电性拓扑状态指数能够将化合物分子的结构信息(拓扑结构、成键价态和原子电子结构等)以数字形式来表征,进而定量地描述分子内部每个原子所处的拓扑环境以及同分子中其他原子间的电性相互作用。其计算含原子本征值与扰动值两部分[17],本征值计算公式如式(1)所示。

式(1)中:δi=σi-h;=σi+πi+ki-h;Ni是原子i上电子层的层数;σi、πi与ki分别是原子i所成σ键数、π键数和孤对电子数;h是直接键合在原子i上的氢原子个数。

由Ii的计算可知,Ni表示的电子层数可表征原子的大小,其数值愈大,本征值愈低。1/δi可表征原子连接程度,即体现原子拓扑结构。δvi/δi表征原子价电子密度,即刻画原子电子结构特征。

原子i本征态所受扰动ΔIi可表示为式(2)。

式(2)中:Ij是原子j的本征值;r2ij是原子i、j间最短路径数加上1。

某原子的电性拓扑状态指数就是该原子的本征值与其他原子对其的扰动值之和,如式(3)所示。

再把属于同一原子类型的全部原子的电性拓扑状态指数计算结果相加,即可得到分子中所含各原子类型的电性拓扑状态指数(electrotopological state indices for atom type,ETSIAT)。

1.3 数据集的建立

要研究绝缘气体分子中基团与绝缘强度间的定量构效关系,必须先确定气体分子的绝缘强度数据、分子的种类与结构。为使绝缘强度数据可靠,本研究根据如下3个原则来寻找和甄别气体中绝缘强度数据[6,12-15]:

(1)本研究采用相同环境条件、均匀电场、相同气体压力和放电间距,同时采用SF6作为内标进行实验测量。

(2)去除对实验结果存在争议的气体分子,如SO2,它的绝缘强度为0.52~1.50,明显无法应用于构效关系模型的构建。

(3)气体样本绝缘强度数据符合正态分布。

所建的样本集含有47 个绝缘气体分子并标有气体CAS(chemical abstracts service)号码,用来区分同分异构体,详见表1,其中Er是相对于SF6的绝缘强度数值,所选数值为临界电气强度。表中含有2~18 个C、H、O、N、S、F、Cl、Br 原子构成的多种有机或无机气体分子,气体类型完整,绝缘强度分布模式较广泛,适用于构效关系模型。样本集气体的绝缘强度Q-Q 图如图1 所示,Q-Q 图将所有样本气体的绝缘强度数值作为X 轴数据,Y 轴数据则对应其正态分布分位数。由图1 可见当绝缘强度低于1时各点均绕对角线分布,表明样本集大部分数据近似于符合正态分布。

表1 绝缘气体绝缘强度数据Tab.1 Insulation strength data of insulating gases

图1 样本气体绝缘强度Q-Q图Fig.1 Q-Q diagram of insulation strength of air samples

2 基于基团贡献的气体绝缘强度QSPR模型

2.1 计算过程及结果

基于以上理论,本文对样本集中47种绝缘气体分子的原子类型电性拓扑状态指数(ETSIAT)进行计算,全部气体分子共有22 种类型的ETSIAT 值。除ETSIAT 外,基团电性拓扑状态指数也能将基团所含全部原子的电性拓扑状态指数相加,以表征基团的电子与结构信息[18],故本文还对绝缘气体分子C5F10O 内包含的羰基与C4F7N 内包含的氰基基团电性拓扑状态指数进行了计算,以丰富绝缘气体样本集中的自变量类型,避免漏掉对气体分子绝缘强度可能产生显著影响的特征基团。表2为两个基团类型电性拓扑状态指数的本征值和绝缘气体分子中所含的原子类型电性拓扑状态指数的本征值,符号S 代表ETSI,s 代表一个单键,d 代表一个双键,t 代表一个三键。

表2 电性拓扑状态指数本征值Tab.2 Eigenvalue of electrotopological state indices

确定了样本数据后,接下来进行自变量的筛选与模型的建立。本文使用逐步多元回归法进行电性拓扑指数的筛选与建模,自变量的筛选原则如下:

(1)为了统计结果的显著性并且对样本能够进行抽一法交互检验(leave-one-out cross validation,LOO-CV),去掉只对1 个样本具有非零值的自变量。

(2)计算并判断每次进出模型自变量F值的显著性水平,在自变量F值显著水平低于0.05时,变量可选择进入模型,若显著性水平高于0.10 则移出模型。

图2 为计算步骤流程图。依照图2 计算流程,采用逐步多元回归法,最后构建回归方程如式(4)所示。

图2 计算流程图Fig.2 Calculation flow chart

式(4)中,各自变量的符号含义如表3所示。

2.2 模型讨论与分析

定量构效关系中的最后一步是模型的检验与评价,最常使用决定系数R2和调整决定系数Adj.R2来检验与评价模型的预测能力和稳健性。经计算得到该模型中决定系数R2=0.899,调整决定系数Adj.R2=0.885,同时利用抽一法交互检验(LOO-CV)对所建模型进行验证,计算得到模型的交叉验证系数=0.849,可见各统计指标均表现良好,说明本研究建立的模型稳定性好、预测能力强。表3 为筛选出来的6个特征基团即各自变量的符号含义和相关统计量数据。自变量标准化回归系数(variance inflation factor,VIF)代表了其他自变量不变情况下自变量变化1 个单位后因变量的平均变化量,可反映它们对绝缘强度的影响程度。

表3 各自变量相关统计量数据Tab.3 Statistics related to each variable

由表3 可知,该模型的各变量与绝缘强度都有明显的正向影响关系,同时各变量间没有自相关关系。

基团的含义在基团取代法中,既可包括单原子也可包括多原子,为便于表达,本研究把经过筛选后全部由单原子或者多原子构成的基团都统一称为基团。因为比起用该模型来预测绝缘强度值,本文更注重通过在分子拓扑指数和绝缘强度之间构建定量函数模型,来得到绝缘气体分子中对其绝缘强度影响显著的基团,以便为用基团取代方式进行绝缘气体分子设计时给出优先考虑的基团种类,所以为避免因结构信息缺失造成预测准确度下降,对不包含这6 个筛选基团的分子,应通过分子层面上的构效关系模型开展预测与计算。

在该模型中,所有基团系数为正,说明随着6个基团的电性拓扑状态指数增大,气体绝缘强度也将增大。其中,=C=的本征值为2.50,位于所有自变量本征值的中间水平,比大多数碳链基团的本征值大,而比其他主族元素基团的本征值小。>CH-的本征值为1.33,处于所有自变量本征值的较低水平,因为其他大部分原子对于>CH-的扰动均为负值,故计算得到的电性拓扑状态指数会比它的本征值要小。=C=和>CH-两种基团均含C 元素,通常充当连接性基团,即组成碳链基本骨架,形成的碳链越长,各原子间相互作用越弱,ETSI 越趋近于它的本征值,即分子内其他原子对其干扰较小。反映到模型中即其对因变量的正向影响增大,使气体分子绝缘强度得到提高。

样本集气体分子中CHFCl2、CHF2Cl、CF3H 不仅具有相似的结构并且均含有>CH-基团,它们的绝缘强度依次为0.92、0.42、0.36。样本集气体分子中含=C=的气体分子有COS 与CO2,其绝缘强度依次为0.90、0.35。两组气体分子结构相同,区别是碳基团所连的同一主族元素电负性不一样。图3为一些主族元素电负性推荐值,可见O 元素的电负性大于S 的电负性,F、Cl、Br、I元素的电负性依次减小。对于同主族元素,在元素周期表位置越靠下,则原子体积越大。故在分子结构一致并且分子中含有相同原子个数的情况下,同=C=与>CH-相连的基团电负性越小,其体积就会越大,其他原子对=C=与>CH-的扰动越小,这对提高气体分子的绝缘强度是相当有利的。

图3 电负性推荐值Fig.3 Recommended value of electronegativity

筛选得到的另外4 个基团,>C=O 本征值为6.67,-Cl 本征值为4.11,-C≡N 本征值为6.50,-F 本征值为8.00,它们的本征值位于全部自变量基团中较高数值水平,受到其他原子的扰动一般为正,故随着它们ETSI的增大,其绝缘强度也将提高。除此之外,4 个基团均具有较高的电负性值,-C≡N 的电负性值是2.80,-Cl 的电负性值是3.16,-F 的电负性值是3.98[19]。因>C=O 碳原子上的另外两个键可与其他原子或基团以单键或者双键的方式结合,所以电负性值具有不确定性,但是通常它们比卤族元素具有更大的电负性。例如>C=O 若与F 原子键合成-COF,则基团的电负性值为3.32。从上述分析中可发现,筛选得到的其他4 个基团在电性拓扑状态指数本征值上均表现出高数值水平,均为高电负性值基团。

相对于量化参数这种分子层面上的分子描述符,本文中计算分子拓扑指数的过程不需要对每一种绝缘气体分子结构进行逐一优化计算,极大地降低了计算成本,并且能够在更精细的基团层面上研究影响气体绝缘强度的因素,得到显著影响气体绝缘强度的特征基团及各自贡献度,为采用基团取代方式进行绝缘气体分子设计提供了优先考虑的基团种类。

3 结论

从基团层面出发,利用分子拓扑指数定量表达绝缘气体分子基团结构,并考察了对绝缘强度有显著影响的基团及贡献度,得到如下主要结论:

(1)用逐步多元回归法筛选出了显著影响绝缘强度的6 个基团:=C=、>CH-、-F、-C≡N、-Cl、>C=O。>CH-及=C=是两种类型碳链的基本骨架,ETSI值较低,当分子结构一致并且分子中含有相同原子个数的情况下,同=C=与>CH-相连的基团电负性越小,其体积就会越大,对提高气体分子的绝缘强度就越有利。

(2)-F、-C≡N、-Cl、>C=O 均具有较高的电负性值,同时ETSI值高,对于绝缘强度有正向促进作用,在设计或筛选SF6替代气体选择基团时可优先考虑,但是也要注意Cl 元素的环保性能受到一定限制,因此若设计的新型气体分子含Cl 原子,则在判断能否推广使用前需开展多重条件下的测试。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!