当前位置:首页 期刊杂志

基于粗糙集与灰色SVM的中国CO2排放量预测

时间:2024-07-28

周建国,张希刚 (华北电力大学(保定)经济管理学院,河北 保定 071003)

根据相关统计数据,2007年中国消费化石燃料而排放的 CO2已经超过美国,成为全球第一大CO2排放国[1].2009年中国一次能源消费量达到 21.77亿t油当量,占全世界一次能源消费量的 19.5%[2].在国内能源供需矛盾日益加剧及全球气候变暖趋势日益严峻的今天,定量分析CO2排放量,对我国的节能减排工作的进行有较强的现实意义.在目前对 CO2排放量的预测研究中多采用自上而下的方法[3-7],在分析中没有考虑到经济、人口、环境等影响因素.本文利用的灰色系统理论适用于对少信息不确定性系统进行分析研究,是对对象系统现有状态向未来延伸的预测系统,根据对象系统的特征数据,充分开发并利用少量数据中的显信息和隐信息,找出因素本身的相关关系,从而了解系统的动态行为和发展趋势[8];支持向量机 SVM(Support Vector Machine)是在统计学习理论基础上发展起来的的一种通用学习方法,是解决非线性分类、函数估算、密度估算等问题的有效手段[9];粗糙集理论可以确定组合预测模型中的权系数,该方法的特点是将权系数确定问题转化为粗集理论中属性重要性的评价问题,这样就从很大程度上克服了传统方法在权重系数确定上主观性太大的不足,而使得权系数的确定更具客观性和合理性[10].

我国的 CO2排放是受多种因素影响的非线性系统,排放规律复杂;此外,我国 CO2排放量的预测问题是典型的小样本分析系统.考虑到这两个因素,采用灰色系统支与支持向量机模型对CO2排放量进行预测,并利用粗糙集的理论方法将组合系数的选择转化为粗糙集中条件属性重要性的评价问题,进行组合预测,克服传统单一预测方法的不足[11-18].

1 基于粗糙集与灰色SVM的中国CO2排放量预测模型的建立

该组合预测模型的建立过程为:(1)建立支持向量机模型(2)建立灰色系统模型(3)根据粗糙集原理,确定组合预测模型的权重系数,建立组合预测模型.

1.1 SVM模型的建立

设有样本训练集(xi,yi),其中xi=Rn为输入空间,yi为输出值,支持向量机的基本思想就是寻找一个从输入空间到输出空间的非线性映射xφ(),将数据映射到高维空间中,构造一个超平面进行数据分类,它采用结构风险最小化代替传统的经验风险最小化,克服了神经网络的许多缺点,在引入不敏感损失函数后,SVM 便可以在高维空间解决非线性问题,进行线性回归预测,构造线性函数:

式中:ω为输入空间权向量;b为阈值;SVM 的ε不敏感损失函数采用如下形式

此函数意味着以超平面为中心构造一个厚度为 2e的区域,如果样本落入该区域,忽略预测值与实际值的差别,当样本落在区域外时,对预测差距进行惩罚,经验风险函数如下:

根据统计学理论的结构风险最小化准则,支持向量机通过最小化结构风险函数来确定回归函数,所以 SVM 回归算法可以表示为如下条件约束优化问题

式中:ξ,ξ*表示训练误差的上限和下限,且ξ,ξ*≥0.

由于特征空间维数很高,所以直接对上式求解几乎不可能,利用 Wolfe对偶技巧并且引入点积核函数k(xi,xj),转为求其对偶问题.

得到回归估计函数为:

设共有m年的排放量数据,每个年度的排放数据共有n个排放指标.X = {X1,X2,…Xm}是CO2排放量的输入集,Y = {y1,y2,…ym}为排放量集,矩阵A= ()表示的是X的指标矩阵,设共有n个指标,aij表示第i年的第j个指标.xi= {ai1,ai2,… ,ain}作为支持向量机的输入向量,yi作为支持向量机的回归目标值.

根据支持向量机理论,排放量预测模型的建立就是寻求下述公式的成立:

1.2 灰色系统GM模型的建立

根据中国 CO2排放量的原始数据,建立灰色系统的原始数列:

式中:0()x t表示在t时期我国CO2的排放量.为了减弱原始数据的波动性,对原始数列进行一次累加生成处理,得到新的数列:

由于序列x(1)(k)具有指数增长规律,而一阶微分方程的解恰是指数增长形式的解,因此可以认为x(1)序列满足下述一阶线性微分方程模型:

简记为:

根据求得a,u的值,得到的灰色预测模型为:

如表1所示,1992~2011年我国CO2排放量的原始数据输入到 MATLAB软件中可计算得出,ˆ= - 0 .06464= 123055.6.对该模型进行后验差检验,后验差比C= 0.16717,小误差概率P= 1,根据表 2中评定灰色预测模型的标准,该模型精度为一级.

表1 综合评定预测模型的小误差概率(P)和后验差比值(C)Table 1 Comprehensive assessment of the small error probability (P) and posterior error ratio (C) of predictive models

1.3 基于粗糙集的我国CO2排放量的组合预测模型的建立

将评估对象数据离散化,可形成一张二维知识表达系统.将各个预测方法视为条件属性,则条件属性的集C= {c1,c2,… ,cm};将预测对象的指标y视为决策属性即D= {y}.第t时期的各个预测方法的预测值和预测对象的历史数据表示为ut= (c1,t,c2,t, … ,cn,t;yt),从 而 论 域U={u1,u,… ,un},此时研究对象ut的属性值:ci(ut) =cit,y(ut) =yt,(i= 1,2,… ,m;t= 1,2, … ,n)由ut(t= 1 ,2,… ,n)构成的二维关系表就是所要研究的基于粗糙集的组合预测方法的知识表达系统.

设R、Q是U上的两个等价关系(称为知识),H0(Q|R)为知识Q关于知识R的信息依赖性,采用Shannon的信息熵对知识的依赖性进行度量.

显然,0≤H0(Q|R) ≤1H0(Q|R)提供了知识Q关于知识R的信息依赖性的一个较为合理的度量.

根据式(1)对每个条件属性ci,计算条件属性集C- {ci}对决策属性D的依赖程度:

若知识C与知识C-ci对知识D的依赖度改变不大,则可认为属性ci的重要程度不高.基于这个观点,属性ci关于决策属性D的重要程度定义为:

将式(2)中的结果带入式(3),可计算得出ic关于决策属性D的重要程度.显然 SGF(ic,C,D)的值越大,说明在条件属性C中属性ic对决策属性D越重要.由此可以计算出每种属性在论域中的重要性程度,即每种预测方法在组合预测中的权重系数:

则基于粗糙集的线性组合模型为:

2 我国CO2排放量基于粗糙集与灰色SVM的组合预测

对于我国 CO2排放量的预测,首先,计算出1991~2011年我国 CO2排放量的数据为原始数据,分别通过支持向量机模型与灰色系统模型对近20年来的CO2排放量进行预测,并以此测算出基于粗糙集的组合预测模型的预测值.然后,通过对单一预测模型与组合预测模型的相对误差对比分析以及这 3种模型的精度对比分析来验证组合预测模型的可行性.最后,分别利用支持向量机模型、灰色系统模型对我国 2012~2017年的CO2排放量进行预测,根据单一预测模型的预测值,利用组合预测模型对我国未来6a的CO2排放进行预测.

2.1 我国近20a CO2排放量估算

由于我国没有直接公布CO2排放量,因此必须使用相关方法进行估算.参照 IPCC(2006)以及国家气候变化对策协调小组办公室和国家发改委能源研究所(2007)的方法[19],利用 CO2排放系数公式,以能源消耗量为基础测算获得下文中的原始样本数据,测算公式如式(12):

其中:Et为在t时期的放总量,44/12为 CO2和碳的分子量比率,为t时期j种能源的标准煤消费量,θj为j种能源的碳排放系数[20].公式中使用的一次能源历年消费量来自《中国能源统计年鉴》与《中国统计年鉴》[21].以1992~2011年的中国 CO2排放量的数据为基础数据,验证基于粗糙集组合预测模型应用于中国 CO2排放量预测的可行性和有效性,基础样本数据如表2所示.

表2 基础样本数据Table 2 Basic data

2.2 单一预测模型与组合预测模型精度比较

首先以相关数据为基础,对单一预测模型与组合预测模型精度的进行验证,以确定最终采用什么预测模型对我国CO2排放量进行预测.具体做法是:以表2中1992~2011年的我国CO2排放量数据为基础,分别采用单一预测模型(SVM 预测模型与灰色系统预测模型)与基于粗糙集与灰色 SVM 的组合预测模型,对该时期我国 CO2排放量进行预测,与原始数据进行比较,进行精度验证,确定精度最高的预测模型.

2.2.1 表3为采用SVM预测模型与灰色系统预测模型所获得的预测值.

2.2.2 进行组合预测就是确定两个单一预测模型的权重,将两个单一预测模型的预测结果进行组合,最终获得组合预测结果.

(1) 组合预测权重的确定

表3 单一预测模型预测值(万t)Table 3 Predictive value of the single prediction model (×104t)

根据1991~2011年,我国CO2排放量的数据,由式(8)、式(9)、式(10)计算出各个预测方法的依赖性H0(C|D),预测方法的重要性 SG F(ci,C,D)和权重系数χi.由于样本数据较多,上述计算结果是通过借助数据挖掘工具 RE软件得出的,计算结果见表4.

表4 权重系数表Table 4 Weight coefficient

(2) 组合预测结果

通过利用数据挖掘软件,计算出个单一预测方法的权重:χSVM= 0 .468,χGM= 0 .532然后根据,基于粗糙集的组合线性模型式(11)计算得出的组合预测的预测结果如表5所示.

表5 组合预测的CO2预测结果(万t)Table 5 The results of combination forecasting model (×104t)

2.2.3 为了反映所建立的基于粗糙集的组合预测模型的有效性,根据预测效果评价原则,选取下列指标,对组合预测模型的精确性、稳定性进行分析.

相对误差,如式(13)所示:

平均相对误差,如式(14)所示:

相对误差的方差,如式(15)所示:

将表1、表3以及表5中的预测值与实际值代入式(14)中,可计算出各种预测模型预测结果的相对误差,其结果如表6所示.对这3种预测方法的相对误差做对比分析,如图1所示.

表6 3种预测模型的相对预测误差Table 6 The relative error of three kinds of prediction model

根据式(14)、式(15)及表5中的数据,计算出各种预测模型的ARE及REV,见表7.

相关研究表明,相对误差不大于 3%,表明模型的预测精度较高,从图 1中可以看出基于粗糙集的组合预测模型的相对误差都在 3%以下,而不论是支持向量机预测模型还是 GM 预测模型它们的预测相对误差基本上都在 4%以上,并且根据图 1中 3种预测模型相对误差的曲线及 3种预测模型的REV来看,组合预测模型的波动更加平稳,这说明组合预测模型在整个预测过程中有更高的预测准确度和更好的稳定性.从这点来看本文所提出的基于粗糙集的组合预测模型是完全有效的.

图1 3种预测方法的相对误差对比分析Fig.1 The comparative analysis of the relative error about three kinds of prediction model

表7 3种预测模型误差对比Table 7 The comparison of error about three kinds of prediction model

为了进一步验证所建立的基于粗糙集与灰色支持向量机的组合预测模型的可行性,将同一时期我国 CO2排放的实际值与 3种预测方法的预测值进行比较分析,如图2所示.灰色系统预测模型在1997年之前及2005年之后的预测值高于实际值,1997~2005年的预测值低于预测值并且在这段时期内它的相对误差也较大,这说明灰色系统模型的预测结果虽然能反映我国 CO2的排放趋势但在预测精度上还存在一定的缺陷.

对于支持向量机模型来说,它所预测的我国CO2排放量的曲线比较平滑,能够反映我国 CO2排放的长期变化趋势,它更适合作为我国长期的CO2排放趋势的预测模型来应用.

在图 2中,组合预测值曲线与实际值曲线有高度的重合性,这说明基于粗糙集的组合预测模型不仅能够很好地预测我国CO2排放的趋势,更能准确地预测CO2排放的数量.

图2 3种预测方法的精度对比分析Fig.2 The comparative analysis of the prediction accuracy about three kinds of prediction methods

2.3 我国未来5年内CO2排放量预测

根据我国 20a来 CO2排放的原始数据通过支持向量机模型与 GM 模型,对我国未来 6a的CO2排放进行单一预测,其结果见表8.

表8 单一预测模型预测值(万t)Table 8 Predictive value of the single prediction model (×104t)

其次,将表 8中的单一预测值代入组合预测模型:

表9 未来6年内我国CO2排放量(万t)Table 9 The next six years of CO2 emissions (×104t)

最后,采用基于粗糙集与灰色支持向量机的组合预测模型,预测出我国2012~2017年的CO2的排放量.

3 结论

3.1 单一预测模型(支持向量机模型、GM模型)的相对预测误差基本上都在 4%以上,在预测精度与稳定性上存在一定缺陷,这 2种方法仅能模拟我国未来CO2排放量的变化趋势;组合预测模型(基于粗糙集与灰色SVM的组合预测模型)的相对预测误差保持在 3%以下,并且组合预测值曲线与实际值曲线有高度的重合性,这说明基于粗糙集的组合预测模型不仅能够很好地预测我国CO2排放的趋势,更能准确地预测CO2排放的数量.

3.2 利用基于粗糙集与灰色SVM的组合预测模型预测出的我国2012~2017年CO2的排放量分别为771088.31,793543.4,811792,831079.96, 851707.6,870938万t.

[1]王 锋,吴丽华,杨 超.中国经济发展中碳排放增长的驱动因素研究 [J]. 经济研究, 2010,(02):123-136.

[2]蒋金荷.中国碳排放量测算及影响因素分析 [J]. 资源科学,2011,(4):597-604.

[3]曹 娟,袁兴中,祝慧娜,等.基于能源结构的 IGT模型对CO2排放量的研究 [J]. 环境科学与管理, 2011,(8):50-54.

[4]王晓明,顾培亮,邱世明.基于非线性理论的 CO2预测方法 [J].管理科学学报, 2002,(4):22-27.

[5]穆海林,宁亚东,近藤康彦,等.中国各地域能源消费及 SO2、NOX、CO2排放量估计与预测 [J]. 大连理工大学学报, 2002,(6):674-679.

[6]李 丹.中国降低CO2排放量潜力的研究 [J]. 环境与可持续发展, 2006,(2):50-52.

[7]秦 钟,章家恩,骆世明,等.我国能源消费与 CO2排放的系统动力学预测 [J]. 中国生态农业学报, 2008,(4):1043-1047.

[8]李兴东,杨 殿.灰色系统预测模型及建模计算机程序 [J]. 湖南有色金属, 1996,(04):8-11.

[9]董雁萍.支持向量机预测模型的构建及其应用 [D]. 西安:西安理工大学, 2010.

[10]张文修,吴伟志.粗糙集理论介绍和研究综述 [J]. 模糊系统与数学, 2000,(04):1-12.

[11]王 江,金占明.基于粗集理论的组合预测法在无形资产评估中的应用 [J]. 数理统计与管理, 2005,(2):45-49.

[12]肖 智,郑大霞.基于粗糙集的组合预测方法在粮食产量预测中的应用 [J]. 统计与决策, 2005,(8):130-132.

[13]田光理,苑红伟,牛德宁.基于粗糙集理论的短时交通流组合预测研究 [J]. 道路交通与安全, 2010,(2):23-26,30.

[14]钟 波,肖 智,周家启.组合预测中基于粗糙集理论的权值确定方法 [J]. 重庆大学学报(自然科学版), 2002,(7):127-130.

[15]陈洪涛,周德群,黄国良.基于粗糙集理论的企业效绩评价指标属性约简 [J]. 计算机应用研究, 2007,(12):109-111.

[16]李远远.基于粗糙集的指标体系构建及综合评价方法研究 [D].武汉:武汉理工大学, 2009.

[17]Li B, Cao Yang. An improved comprehensive evaluation model of software dependability based on Rough Set Theory [J]. Journal of Software, 2009,4(10):1152-1159.

[18]Ravi shankar N, Ravi Kumar B, Srikanth T. Rough set model using Lattice theory [J]. International Journal of Machine Intelligence, 2010,(1):89-92.

[19]国家气候变化对策协调小组办公室、国家发改委能源研究所.《中国温室气体清单研究》[M]. 北京:中国环境科学出版社,2007.

[20]查冬兰,周德群.地区能源效率与二氧化碳排放的差异性——基于Kaya因素分解 [J]. 系统工程, 2007,(11):65-71.

[21]《2011年中国统计年鉴》、《中国能源统计年鉴》[M].北京:中国统计出版社, 2011.

[22]张立民,刘 峰,刘 凯.一种基于粗糙集理论的支持向量机分类算法 [J]. 中国电子科学研究院学报, 2012,(3):241-245.

[23]李远远.基于粗糙集的指标体系构建及综合评价方法研究 [D].武汉:武汉理工大学, 2009.

[24]张国军.基于粗糙集的相对属性约简算法及决策方法研究 [D].武汉:华中科技大学, 2010.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!