当前位置:首页 期刊杂志

机器学习LGBM回归算法预测混凝土强度

时间:2024-07-28

刘永红 屈希峰

混凝土强度关乎土木结构安全,影响混凝土强度的因素诸多,文章采用机器学习LGBM回归算法分析台湾重华大学信息管理系叶怡成教授的混凝土强度试验相关数据,通过数据分析验证影响混凝土强度各因素的重要性,并回归预测混凝土强度。该分析方法可用在其他室内试验或监测检测领域,为决策提供依据。

土木工程; 机器学习; 混凝土强度; LGBM回归算法

TU528B〗

[定稿日期]2021-06-22

[作者简介]刘永红(1979~),男,硕士,高级工程师,从事岩土工程设计与施工工作。

混凝土强度是现代土木工程结构安全的基本保障,更是建筑施工从业人员在项目中经常要面对的重要问题。一般情况下,混凝土具有较高的抗压强度(抗拉强度相对较低,约为抗压强度120~110),因此,抗压强度是施工过程中控制和评定混凝土质量的主要指标。根据GB 50010-2010《混凝土结构设计规范》规定:“混凝土强度等级应按立方体抗压强度标准值确定。立方体抗压强度标准值系指按照标准做法制作养护的边长为150 mm的立方体试件,在28 d龄期用标准试验方法测得的具有95 %保证率的抗压强度”[5-6]。

根据工程经验,混凝土强度与水灰比、湿度、温度及骨料等因素密切相关。例如:相同水泥强度等级下,水灰比越小,水泥石的强度就越高,其与骨料之间的黏结力也就越大,混凝土强度也就越高。假如湿度不足,会减缓水泥水化反应,进而会使得混凝土结构变得松散,渗水性变大,导致混凝土的强度降低。其次,混凝土硬化的关键在于水泥的水化作用是否充分,温度升高时,水泥水化速度加快,混凝土强度上升也快。混凝土强度最主要取决于水泥石强度与骨料表面的黏结强度,增大骨料的强度也有助于提升混凝土强度。本文通过分析台湾重华大学信息管理系叶怡成教授的混凝土强度试验数据,通过数据分析证实以上工程试验结论,并采用LGBM回归算法预测混凝土强度[1]、[8]。

1 数据描述

本文所采用的Concrete Compressive Strength数据集[9],该数据集中包含1 030组数据,每组数据由9个参数组成,分别为:水泥、矿渣、粉煤灰、水、减水剂、粗骨料、细骨料、养护龄期、抗压强度(表1、表2)。

从表2检测结果整体描述可以看出该数据集无缺失值以及各数据的分布范围。

2 特征重要性分析

2.1 特性向量相关性

统计学的相关系数经常使用的有3种:皮尔森(pearson)相关系数和斯皮尔曼(spearman)相关系数和肯德尔(kendall)相关系数。其中,皮尔森相关系数是衡量线性关联性的程度,p的一个几何解释是其代表两个变量的取值根据均值集中后构成的向量之间夹角的余弦,计算如公式(1)所示。

如果有两个向量:X、Y,最终计算出的相关系数的含义可以有如下理解:

(1)当相关系数为0时,X和Y两变量无关系。

(2)当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。

(3)当X的值增大(減小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。

相关系数的绝对值越大,相关性越强,相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。经计算分析,与混凝土强度(目标集)相关的前8列数据(测试集)的相关性如图1所示。

ρx,y=cov(X,Y)σxσy=EX-μxY-μyσxσy=

E(XY)-E(X)E(Y)EX2-E2(X)EY2-E2(Y)(1)

根据图1可以看出,减水剂与粉煤灰呈正相关;减水剂与水呈负相关;减水剂与矿渣无关系。

2.2 特征重要性排行

为进一步分析各因素对混凝土强度的影响程度,对各特征向量的重要性进行排行,如图2所示。

根据图2,可以看出减水剂和水泥对混凝土的强度影响较大,究其原因,它们决定着水泥石强度与骨料表面的黏结强度;而随着养护龄期增加,混凝土中的水化反应更充分,粘结强度更高。矿渣和粉煤灰都能部分替代水泥,节约成本,改善混凝土的和易性;但其会加大混凝土收缩量,细度不达标时还可能造成泌水。粗细骨料自身抗压强度很高,其对混凝土强度的影响相对较小。除了参与化学反应的少量水之外,其他多余的水主要是增加混凝土和易性,这部分水与混凝土强度呈负相关,更进一步说明了减水剂的重要性。

3 LGBM回归分析

3.1 LGBM计算原理

LGBM由微软提供,它和XGBoost一样是对GBDT(梯度下降树)的高效实现,原理上它和GBDT及XGBoost类似,都采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。LGBM采用histogram算法,其核心是将连续的浮点特征离散成k个离散值,并构造宽度为k的Histogram。然后遍历训练数据,统计每个离散值在直方图中的累计统计量。在进行特征选择时,只需要根据直方图的离散值,遍历寻找最优的分割点[2-3]。

假设训练集有n个实例x1…xn,特征维度为s。每次梯度迭时,模型数据变量的损失函数的负梯度方向表示为g1,…,gn,决策树通过最优切分点(最大信息增益点)将数据分到各个节点。GBDT通过分割后的方差衡量信息增益,例如O表示某个固定节点的训练集,分割特征j的分割点d定义为:

Vj|O(d)=1nO∑xi∈O:xij≤dgi2njl|O(d)+∑xi∈O:xij>dgi2njr|O(d)(2)

式中:

nO=∑Ixi∈O,njlo=∑Ixi∈O:xi≥d,njr|O=

∑Ixi∈O:xi>d

遍历每个特征的每个分裂点,找到dj=argmaxdVj(d),并计算最大的信息增益Vj(dj),然后,将数据根据特征j的分裂点dj将数据分到左右子节点[4]、[7]。

3.2 LGBM回归分析

本文分析使用Python语言,安装LGBM库,在Jupyter Notebook中加载数据进行分析(图3)。

图3中,Best Fit为离散点的最佳拟合曲线,Identiy为回归预测曲线,直观体现了预测的一致性。R2即r2_score,数值计算采用式(2),区间通常在(0,1)之间;模型越好R2越趋近1,模型越差R2越趋近0。

3.3 模型测试

随机选择5行数据进程测试,用机器学习训练好的模型进行预测,结果见表3。

4 结论

(1)减水剂和水泥对混凝土的强度影响较大,若设计或施工过程中弄错混凝土标号,将会导致严重工程质量事故。

(2)未养护或养护不到位,会导致混凝土强度不足、前期强度增长慢等病害。

(3)矿渣和粉煤灰对混凝土强度也有较大贡献,可部分替代水泥。

(4)水量与混凝土强度负相关,施工过程中要严格控制加水量。

(5)采用LGBM回归分析预测混凝土强度,误差可以满足工程需要。若野外室内试验条件有限,可以通过影响因素预预估混凝土强度。

(6)本文的分析方法可用在其他室内试验或监测检测领域,为决策提供依据。

参考文献

[1] 李航.统计学习方法[M].北京:清华大学出版社,2012.

[2] 卢锦玲,郭鲁豫,张梦雪,等.基于MGS-LGBM算法的电力系统暂态稳定评估[J].电力科学与工程,2020(3):1-9.

[3] 張旭东,钱仲文,沈思琪,等.一种基于LSTM与LGBM的电力负荷预测算法[J].系统工程,2019,37(1):152-158.

[4] 王向鹏. 基于不平衡三分类LGBM模型的贷后风险预警研究[D].兰州:兰州大学,2019.

[5] 李辉.基于BP神经网络的水泥细度软测量方法[J].中国水泥,2016(7):107-109.

[6] 李仲欣,韦灼彬,沈锦林.相关向量机在珊瑚混凝土抗压强度预测中的应用[J].混凝土,2016(7):1-6.

[7] 唐华松,姚耀文.数据挖掘中决策树算法的探讨[J].计算机应用研究,2001,18(8):18-19.

[8] XGBoost:A Scalable Tree Boosting System. Chen T,Guestrin C. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2016.

[9] Yeh I.C. Modeling of strength of high performance concrete using artificial neural networks[J]. Cement and Concrete Research,1998,28(12):1797-1808.

3045501908295

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!