当前位置:首页 期刊杂志

基于GA-BP 神经网络的汽车空气阻力系数预测研究

时间:2024-06-19

姜丰, 李卓, 汪怡平

(武汉理工大学 现代汽车零部件技术湖北省重点实验室,武汉 430070)

随着一系列能耗政策的出台,续驶里程成为了消费者购车时的重要参考指标,甚至会决定其购买意向。汽车空气动力性能与续驶里程的相关性极强,降低空气阻力系数是提升汽车续驶里程最经济的手段之一。此外,降低空气阻力也是汽车行业实现“双碳”目标的重要途径。

在整车空气动力性能开发中,通常采用数值计算确定概念车型的空气阻力系数,通过反复的造型修改和仿真尝试,将空气阻力系数控制在风险范围内,最后进行风洞试验验证。这种开发思路对计算资源要求极高,需耗费大量时间,难以满足当前汽车开发周期短、响应快的需求。因此,在现代工程开发中,急需一种能快速高效获得汽车空气阻力系数的方法。

自人工智能及机器学习兴起以来,基于数据驱动的空气动力特性建模在空气阻力系数预测方面得到初步应用。ANDRÉS-PÉREZ[1]重点探讨了利用机器学习技术对数值计算结果进行数据挖掘的可能性,展现了机器学习在空气阻力系数预测上的巨大潜力。目前,利用机器学习实现空气阻力系数预测主要有两种方式:一是基于深度学习,根据输入图形实现风阻预测,如CHEN Hai 等[2]基于卷积神经网络提出了一种飞机翼型空气动力系数的图形预测方法;二是基于浅层监督学习,根据特征参数实现风阻预测,如GUNPINAR 等[3]通过提取汽车纵截面二维轮廓特征,建立回归模型进行空气阻力系数预测,ANDRÉS-PÉREZ 等[4]比较了各种回归模型在不同机翼形状空气阻力系数预测方面的效果,机器学习方法能有效减少仿真次数。

在项目开发中,应尽可能减少数据集容量,缓解仿真压力,降低计算成本。深度学习模型泛化能力强,能自动提取特征,但对数据量要求过高[5],样本数量在1 000 个以上,短期内难以实现工程应用。监督学习具有模型结构简洁,计算效率高及建模需求数据量较小等优点,因此,更适用于汽车空气阻力系数预测。

在监督学习的主流算法中,极端梯度增强算法、支持向量回归以及BP 神经网络等诸多模型均可实现数据挖掘及预测[6]。其中,BP神经网络作为一种具有代表性的监督学习算法,具有训练速度快、拟合程度高等优点,已被广泛应用。

本文拟将BP 神经网络应用到汽车空气阻力系数预测中,通过流场仿真获取数据集,利用BP 神经网络建立预测模型,并使用遗传算法(GA)对BP 神经网络初始权值及阈值进行寻优,最终得到GA-BP神经网络模型。在训练集样本容量较小的条件下,该模型只需输入汽车特征参数即可获得精度较高的空气阻力系数预测值,从而为快速得到汽车空气阻力系数提供了一种新方法。

1 数据集建立

1.1 阶梯背式MIRA模型

MIRA 模型组是由MIRA 公司提出的经典汽车模型组,具有普遍代表性。国内外学者已经对各类MIRA模型做过大量研究,试验数据丰富[7]。

阶梯背式MIRA 模型保留了较多汽车特征造型,其基本结构及总体尺寸如图1所示。

图1 阶梯背式MIRA模型

1.2 外流场计算

1.2.1 计算域确定

计算域尺寸参考中国汽车工程学会发布的乘用车空气动力学仿真技术规范[8]来确定,如图2 所示,计算域基本尺寸见表1,其中速度入口与车头距离L1超过3倍车长,压力出口与车尾距离L2超过8 倍车长。阶梯背式MIRA 模型正投影面积为1.856m2,满足阻塞比要求。

表1 计算域尺寸

图2 计算域

湍流模型选择realizablek-ε模型,空气设置为恒密度气体。为保证雷诺数满足要求,速度入口风速赋值为110 km/h,出口压力为0。

1.2.2 网格生成

网格生成方式选择切割体网格,并设置棱柱层。为减小网格数量,在速度入口、压力出口及计算域壁面处禁用棱柱层。棱柱层数量为5 层即可满足精度要求,其中延伸率为1.2。

为提高计算精度,除对车身面网格设置面加密控制外,同时设置4 层体加密区,如图3 所示。不同加密区的位置、大小及加密网格尺寸见表2~3。

表2 加密域位置及大小

表3 加密网格尺寸

1.2.3 仿真结果验证

为排除体网格数量差异带来的影响,验证3 组不同体网格数量下的仿真结果,并与风洞试验结果对比[9],见表4。

表4 仿真结果对照表

在体网格数达到1 252 万个时,空气阻力系数误差为2.02%,计算精度满足要求。

1.3 变量选择

一般地,发动机盖倾角与汽车头缘高度相关,它和前风窗倾角一起影响整车迎风面气流状态,从而改变正压区分布范围,而后风窗倾角和离去角则会直接影响尾涡到汽车尾部距离[10],这些特征参数均会对汽车空气阻力系数产生显著影响。王佳等[11]的研究结果表明,发动机盖倾角对MIRA 模型空气阻力系数的影响最显著,其次是后风窗倾角和离去角,而前风窗倾角影响程度最小。因此,选择前发动机盖倾角α、后风窗倾角β、离去角γ作为预测模型输入变量,如图4所示。

图4 特征参数

特征参数的取值会受到各种因素的影响,不能过分脱离工程实际。最终发动机盖倾角α、后风窗倾角β及离去角γ的变化范围和梯度,见表5。

表5 特征参数及变化梯度

1.4 构建数据集

分别对表内3 种特征参数组合的64 种MIRA 模型进行仿真计算,从而建立包含64 组不同特征参数和相应空气阻力系数的数据集,按照3∶1 的比例随机划分成训练集和测试集,训练集数据见表6,测试集数据见表7。将原始数据的输入变量映射至区间[-1,1],保证输入数据范围的差别不会对训练时间及效果产生影响。

表6 训练集样本数据

表7 测试集样本数据

2 GA-BP神经网络预测模型

2.1 传统BP神经网络模型

2.1.1 BP神经网络

BP 神经网络即误差逐层反向传播的人工神经网络,能很好地解决非线性数据问题。在神经元数量足够时,甚至能拟合任何函数[12]。

数据集的输入变量有3 种,在样本数量较少的情况下,采用单隐含层神经网络即可满足预测精度要求。建立的BP神经网络基本结构如图5所示,由输入层、隐含层及输出层组成,输入层由3 个神经元组成,输出层由1 个神经元组成,不同神经元之间连接的权值和阈值均不相同。

图5 BP神经网络结构

2.1.2 隐含层神经元数量选择

BP 神经网络的隐含层神经元数量对预测精度影响较大,当隐含层神经元数量过少,网络提取数据信息能力较差,而当隐含层神经元数量过多,则会出现“过拟合”[13],即预测模型学习并保留了数据的错误信息。

首先通过经验公式[14]确定隐含层神经元个数范围,如式(1)所示。

式中:m为隐含层神经元个数;n为输入层神经元个数;而α为[1,10]区间内的整数。

在训练样本相同的条件下,测试不同隐含层神经元个数对神经网络预测精度的影响。

为准确评判模型性能,采用EMSE(平均平方误差)、EMAPE(平均绝对百分比误差)和R2(决定系数)3种评价指标,如式(2)~(4)所示。

式中:EMSE为平均平方误差;EMAPE为平均绝对百分比误差;yi为真实值,而yi′为预测值。其中,EMSE和EMAPE越接近0,且R2越接近1,则表明该模型的预测精度越高。

详细结果见表8,随着神经元个数增加,预测精度逐渐提高,在神经元个数达到10 时,平均平方误差EMSE降为0.6%,继续增加神经元个数可能会导致过拟合,所以隐含层神经元个数选择10。

表8 隐含层神经元个数对预测精度关联表

2.1.3 预测结果分析

传统BP 神经网络模型虽能实现汽车空气阻力系数快速预测,但存在以下问题。

1)预测鲁棒性较差。一般地,当隐含层神经元数量越多时,神经网络模型预测精度越高。如表8数据所示,在神经元数量分别为6、7、10 及11 个时,其预测精度呈现为相反的结果。因为除隐含层神经元数量影响以外,神经网络创建时随机生成的权值及阈值对预测模型的泛化能力亦会产生较大影响,所以这直接导致BP 神经网络预测精度的波动。初始权值及阈值的随机性会降低预测模型的鲁棒性,需要寻找并固定最优权值及阈值,以保证模型预测精度稳定。

2)泛化能力不足。汽车空气阻力系数的精确程度会直接影响诸如动力经济性设计等其他性能的目标达成,对整车性能达标产生重大影响。因此,预测汽车空气阻力系数时,应尽可能提高模型预测精度。传统BP 神经网络的初始权值及阈值为随机生成,泛化能力及预测精度存在提升空间。

为解决上述问题,需将智能优化算法运用于BP神经网络的初始权值及阈值寻优。

2.2 GA-BP神经网络模型

2.2.1 GA-BP神经网络建立

遗传算法(GA 算法)源于对自然界遗传和选择机理的模拟研究,具有搜索效率高、不易陷入局部最优解等优点[15]。

GA-BP 神经网络搭建流程如图6 所示。根据已确定的神经网络拓扑结构,随机产生初始权值及阈值,并编码为基因数据,建立初始种群。将所有个体对应的神经网络预测误差返回,作为适应度函数,计算初始种群的个体适应度。对旧种群进行选择、交叉和变异等操作,获得新一代种群,并计算适应度。在若干代种群更新后,将最优个体的基因数据解码获得权值及阈值,即实现GA 算法寻找BP神经网络的最优初始权值和阈值。完成训练后,利用测试集样本验证模型预测精度。

图6 GA-BP神经网络建模和寻优流程

初始种群规模设置为50 个,进化次数为100代,适应度函数设置为神经网络预测平均平方误差的倒数。BP神经网络拓扑结构及参数保持不变。

2.2.2 预测结果分析

遗传算法迭代过程如下,图7 为每代种群的神经网络预测值和仿真值的均方误差,图8 为适应度曲线。蓝色曲线为个体最小平均平方误差,红色曲线为群体平均平方误差。个体最优适应度呈现阶梯式变化趋势,即需通过一定代数的更新,种群才能出现适应度更优的个体。种群平均适应度保持上升,保证遗传算法的快速收敛。种群的个体最优适应度在第60 代已接近最高值。在较少的迭代时间内,GA-BP神经网络预测误差已达到极小值。

图7 平均平方误差变化曲线

图8 适应度变化曲线

算法预测效果对比如图9~10 所示,在相同样本下,GA-BP神经网络的预测精度和泛化能力明显强于传统BP 神经网络。黄色菱形点代表GA-BP 神经网络预测值,基本处于对角线附近。红色方形点代表传统BP 神经网络,不少节点偏离对角线较远。

图9 GA-BP和BP训练集预测对比

图10 GA-BP和BP测试集预测对比

详细预测结果如图11~12 及表9 所示。在16组测试样本中,模型预测结果与仿真值基本一致,预测误差在0.001以内。

表9 测试集样本预测结果

图11 训练集详细预测结果

图12 测试集详细预测结果

评价指标情况见表10~11,GA-BP 神经网络在EMSE和EMAPE两项指标上均明显小于传统BP 神经网络,且R2提升程度约为1.9%。

表10 训练集预测结果对比

表11 测试集预测结果对比

综上所述,将GA算法用于BP神经网络初始权值及阈值寻优时,收敛速度快,寻优效果好。相较于传统BP 神经网络而言,GA-BP 神经网络的预测精度显著提升,鲁棒性更强。

2.2.3k折交叉验证

k折交叉验证是指将原有数据集随机划分为k个相同容量的子集,并将其中k-1 个子集作为训练集用作模型学习,剩余的1 个子集作为测试集,检验模型性能,如此重复k次,最终返回k次测试的平均误差,最终作为评估模型的性能指标,具体流程如图13所示。

本文数据集样本数量为64 个,k取值为16,对GA-BP 神经网络模型进行交叉验证,结果见表12,如表可见,k折交叉验证结果与随机划分测试集测试结果基本一致,这也证明了模型的泛化能力较强。

3 样本数量对预测精度的影响分析

GA-BP神经网络模型通过输入特征参数即可实现高精度的空气阻力系数预测,这证明通过建立GA-BP神经网络模型来预测空气阻力系数具有可行性。但数据集容量为64,所需仿真次数过多,难以满足工程需求,因此需验证训练集样本数量对预测精度的影响,以确定在较少样本数量下预测模型能否满足精度要求。拟通过正交试验法[16]来设计样本容量较小的训练集。

选取标准正交表L32(43)作为基准,选取32 组训练样本,以4 为梯度设置不同容量的训练集,分别用于训练模型,并使用相同测试集进行测试,测试结果见表13。

表13 样本数量对预测精度影响

根据测试结果可知,GA-BP 神经网络仅需28组训练样本,即可满足模型预测精度要求,此时EMSE小于1%,而EMAPE小于0.5%,且决定系数接近98%。综上可知,在小样本容量条件下GA-BP神经网络可实现空气阻力系数的高精度预测。

4 结论

本文通过数值模拟获得汽车空气阻力系数,构建包含不同特征参数及空气阻力系数的数据集,最终建立基于GA-BP 神经网络的预测模型,并验证不同训练集样本容量对预测精度的影响。研究结论如下。

1)利用GA-BP 神经网络预测汽车空气阻力系数,当随机选取测试集或k折交叉验证时,测试评价指标R2均大于99%,模型预测精度高。GA 算法优化效率较高,在种群更新至第60 代时,个体最优适应度已达到极大值。GA-BP神经网络为空气阻力系数的快速准确预测提供了一种新思路。

2)通过正交试验法选取样本能将训练集容量降至28 组,此时EMSE小于1%,而EMAPE小于0.5%,且决定系数接近98%,预测精度满足需求。采用正交试验法选取样本能有效减少训练集容量,减小数据集建立时的仿真压力。

5 展望

现有模型仍存在一些问题,后续工作将主要从以下两个方面展开。

1)验证模型对于其他离散值的适应性。现有数据集样本均为相同间距离散数据,后续可选择更小梯度的离散值或不同间距离散值作为样本数据,从而检验模型对多种离散值样本的适应性。

2)扩大车型样本量。将该模型应用于多种实际车型中,选取具有普适性的整车特征参数作为预测模型的输入,比如前、后风窗的倾角、离去角等,验证该模型在预测实车空气阻力系数时的准确性。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!