2023年12月31日发(作者:1999年初一数学试卷)

中国碳排放量的组合模型及预测

肖枝洪;王明浩

【摘 要】根据碳排放的演化规律,采用ARIMA模型与BP神经网络集成的组合模型,对中国碳排放量进行预测研究;取1980-2007年中国碳排放量作为训练样本,确定模型参数;然后取2008-2013年中国碳排放量作为测试样本对文中的组合模型进行验证,并与已有文献所建立的预测模型进行比较,结果显示,此处所建立的组合模型预测误差极小;最后,根据组合模型对2014-2020年中国碳排放量进行预测,指出中国还将继续面临碳减排压力.

【期刊名称】《重庆工商大学学报(自然科学版)》

【年(卷),期】2016(033)001

【总页数】7页(P9-15)

【关键词】ARIMA模型;BP神经网络;碳排放;组合模型

【作 者】肖枝洪;王明浩

【作者单位】重庆理工大学数学与统计学院,重庆400054;重庆理工大学数学与统计学院,重庆400054

【正文语种】中 文

【中图分类】F206

随着全球气候逐渐变暖,各国开始着手研究其原因[1],结果表明,气候变暖的主因是二氧化碳过量排放,从而提出碳排放量这一概念。中国碳排放量预测的准确与否极大地影响着中国未来的发展及绿色城市构建。目前,关于碳排放量预测的方法

主要分为两种。第一种是分析碳排放量与其影响因素之间的关系,构建能源消费模型,随后基于情景分析法对碳排放量进行预测。但不足之处在于,情景分析法会受到较大主观因素的影响。第二种根据碳排放量过去变化的趋势对未来碳排放量进行预测[2],其主要采用时间序列方法,如ARIMA模型。ARIMA模型的优点在于简单、灵活、可行。但其局限于研究序列的线性关系,不能反映序列的非线性关系。然而在实际情况中,绝大多数时间序列都包含了非线性关系[3]。神经网络模型具有较强的学习与数据处理能力,可以提取数据中隐含的非线性关系,在预测中得到了广泛应用[4-5]。但神经网络模型在处理呈现线性关系的数据时,其结果往往不如ARIMA模型。因此,采用单一的模型进行预测效果不佳。

Zhang[6]认为时间序列过程是由线性和非线性部分组合而成的。肖枝洪[7]等提出用干预模型与BP神经网络集合的组合模型预测中国的GDP。其研究结果表明,组合模型比单一模型预测的准确性高。为了提高中国碳排放量预测精度,拟将ARIMA模型与BP神经网络相结合,构造组合模型,对中国2014—2020年碳排放量进行准确预测。

1.1 ARIMA(p,d,q)模型

ARIMA(p,d,q)模型[8]的结构为

其中,,∀s

1.2 BP神经网络

BP神经网络是神经网络中广泛应用的一种模型[9],它包括输入层、隐含层和输出层。隐含层可以有一层或者多层,相邻上下层之间的神经元实现全部连接,而每层各神经元之间相互独立,如图1所示。

BP神经网络的原理是通过样本数据的训练,不断修正网络的权值和阀值,使误差

函数沿负梯度方向下降,逼近期望输出。训练数据由输入层单元传到隐含层单元,经隐含层单元逐个处理后传到输出层单元,由输出层单元处理后产生输出模式。若输出模式与期望输出模式有误差,则将误差值沿着连接通路逐层传送并修正各层的连接权值,即网络状态前向更新和误差反向传播,通过反传误差函数,不断调节网络的权值,使误差函数达到极小。

1.3 基于ARIMA模型与BP神经网络的组合模型

1.3.1 组合模型建立步骤

组合模型的构建步骤如下:

1) 利用模型(1)对时间序列Xt建立ARIMA模型,得到拟合值t及残差。

2) 运用BP神经网络模型来拟合残差序列。设网络输入有n个,将残差关系表示成

其中,f为神经网络模型的非线性函数,nt为随机误差。

3) 由模型(1)和模型(2)建立组合模型如下:

1.3.2 模型的评价方法

所建立模型的预测性能通常通过目标变量的观测值与预测值进行比较来判断。其评价标准有平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、归一化均方误差(NMSE)、归一化平均绝对误差(NMAE),表达式如下:

2

其中,yt为目标变量的观测值,t为目标变量的预测值,为目标变量观测值的均值。

平均绝对误差(MAE)表示预测值与真实值偏差的绝对值均值;均方误差(MSE)表示预测值与观测值偏差的平方均值;均方根误差(RMSE)是均方误差的开方;归一化均方误差(NMSE)表示计算模型预测性能和基准模型预测性能之间的比率,可以评价模型得分的好坏。NMSE的取值为(0,1)区间,如果模型表现优于非常简单的基准模型,那么NMSE应明显小于1。NMSE的值越小,模型的性能越好。

2.1 数据来源及描述

中国碳排放量数据由全球碳计划(Global Carbon Project)所提供,如表1所示。

为方便计算,用{Xt}表示中国碳排放量序列,以1980—2007年中国碳排放量数据作为训练样本,建立模型;再以2008—2013年中国碳排放量数据作为测试样本,用来检验所建立模型的优良性。

2.2 中国碳排放量组合模型的建立

首先对{Xt}进行探索性分析,运用R软件对训练样本绘制1980—2007年{Xt}时序图,如图2所示。根据图2可以看出,1980—2007年中国碳排放量呈现指数上升趋势。对其进行对数变换,即Yt=ln(Xt),经过变换后Yt的时序图,如图3所示。从图3可以看出,在1998—2002年中国碳排放量上升趋势较缓,但其他点连线,近乎呈现出线性上升趋势。所以,认为经过变换后的序列Yt呈现线性趋势,同时,也可以发现Yt为非平稳序列。

进而对Yt进行一阶差分,记为Yt。绘制Yt时序图,如图4所示。从图4可得出,Yt均值在0~0.1区间内波动,认为均值不为0;对Yt进行PP单根检验,值为0.217,未通过其检验,由此可知,Yt为非平稳序列。继续对Yt进行二阶差分,记为2Yt。绘制2Yt时序图,如图5所示。由图5可知,2Yt均值在-0.05~0.05内周围波动,认为是零均值;并且对2Yt进行PP单根检验,p值小于0.01,通过其检验,由此可知2Yt为平稳序列。

因为进行二阶差分后的序列2Yt基本平稳,所以确定Yt的模型为ARIMA(p,2,q)模型。下面确定p和q的值。

用R软件绘制2Yt自相关函数图,如图6。由图6可以看出,2Yt在5阶和14阶(lag=5,14)的自相关系数分别为-0.278和-0.287,超出了[-0.2,0.2]区间,但是,其他1~20阶的自相关系数都在置信区间内(图中虚线部分内),认为该序列基本截尾,故取p=0。

用R软件绘制2Yt的偏自相关函数图,如图7所示。由图7可知,2Yt在5阶、6阶、7阶、14阶(lag=5,6,7,14)的偏自相关系数分别为-0.284,-0.239,-0.258,-0.261,超出了[-0.2,0.2]区间较多,但是其1~20阶的偏自相关系数都在置信区间内(图中虚线部分),故q≠0。进而,根据建模最简原则和BIC准则,确定q=1,同时得参数θ的估计。故Yt的ARIMA(0,2,1)模型表达式如下:

对模型(4)的残差进行Ljung-Box检验,其p值为0.951 7,此残差序列通过白噪声检验,认为模型(4)合适,可以用来预测。从模型(4)可以看出,时刻t的Yt会受到前一时刻Yt-1的正影响,同时,也会受到前两时刻Yt-2的负影响。也就是说,第t年的碳排放量,会受到其前一年与前两年碳排放量影响,但影响程度不一样。同时,时刻t的Yt,不仅受到当期的随机因素影响,而且也受到前一时刻的随机因素影响。

利用模型(4)对1982—2007年Yt进行拟合,得到拟合值t,及残差序列,其值见表2。

利用模型(4)预测出2008—2013年Yt的值,记为,其值见表3。

采用1982—2007年所计算的残差et构建BP神经网络模型。此模型为单隐含层结构,输入层节点数为3,隐含层节点数为3,输出层节点为1,权重调整速度为0.1,最大迭代数为1 000,即用et-1,et-2,et-3来计算预测et。根据构建的BP神经网络模型,预测2008—2013年et的值,记为,其值见表3。

将2008—2013年的预测值与残差预测值叠加,记为,即,结果见表3。

将和进行指数变换得到2008—2013年中国碳排放量的预测值分别为。

根据变换后的数据对模型进行评价。将2008-2013年中国碳排放量的观测值Xt,ARIMA模型预测值,组合模型的预测值及其相对误差率列表,如表4所示。从表4可以看出,组合模型的预测性能很好。组合模型预测的相对误差率大都小于ARIMA模型的相对误差率,并且组合模型的平均相对误差率为0.8%,明显小于

ARIMA模型的平均相对误差率2.07%。

2.3 模型预测性能的评价

将两个模型5种评价准则的结果列表,如表5所示。由表5可以看出,组合模型与ARIMA模型的NMSE,NMAE接近于0,NMSE,NMAE越小表示模型的预测性能越好,所以,两个模型都具有良好的预测能力。其中,组合模型的NMAE与NMSE均比ARIMA模型小一个数量级。通过对MAE,MSE,RMSE的比较可以发现,组合模型的预测能力是ARIMA模型不可比拟的。

唐建荣[10]采用随机森林模型预测的平均相对误差率为1.931 5%,偏最小二乘预测的平均相对误差率为2.537 61%,也比此处提出的组合模型的平均相对误差率0.873 37%大得多。从而可以看出,此处所建立的组合模型对中国碳排放量预测显示出了优良性。

现利用1980-2013年的数据按照上述方法建立组合模型(5):

其中,当时间t为1982—2013时,。

3.1 中国碳排放量预测结果

由所建立的组合模型(5)对2014—2020年中国碳排放量进行预测,预测结果如表6所示。

由表6可知,从2014年开始,中国碳排放量将会以每年100百万t甚至更高的速度增长,直到2020年中国碳排放量为3 695.82百万t,将会是2013年的1.36倍。

3.2 结果分析

中国碳排放量持续增长,为探索中国碳排放量的增长规律,将表1与表6数据联系起来,绘制出1980—2020年中国碳排放量趋势图,如图8所示。由图8可以看出,中国碳排放量发展有4个阶段。第一阶段,从1980年开始到1997年,中国碳排放量呈现上升趋势。第二阶段,中国碳排放量在1998年先下降,然后从

1999年开始缓慢上升持续到2003年,此阶段与1996年之前相比增长速度较慢。第三阶段,从2003年转折,到2013年中国碳排放量呈现出了前所未有的快速上升状态。第四阶段,2014—2020年中国碳排放量依旧持续快速上升,其年均碳排放量为3 244.99百万t(图中第一条虚线),是1980—2013年的年均碳排放量1

128.35百万t(图中第三条虚线)的2.88倍。因此,中国在2014—2020年的发展中应更加关注节能减排,控制碳排放增长。

中国碳排放量增长依旧显著。根据1980—2020年中国碳排放量,经计算得出1981—2020年中国碳排放增长率,并绘制折线图,如图9。从图9可以看出,中国碳排放量增长率几乎在0~10%区间内波动,且1981—2013年平均碳排放增长率为6.09%,2014—2020年预测的年均碳排放增长率为4.46%,1981—2020年平均碳排放增长率为5.81%(图中虚线部分)。所以,中国碳排放量会一直持续增长,并且越往后增长的速度越快。这意味着中国将面临前所未有的减排压力。

合理制定减排额度。根据模型(5)可知,当年的中国碳排放量,主要受其前一、两年的碳排放量影响,并且其前一年的碳排放量对当年的碳排放量影响较其前两年更大。因此,中国在未来的能源减排中,应实行逐年减排的政策。在制定减排计划时,应根据前一年的碳排放量合理制定减排额度。

预测模型评价及意义。此处所建立的组合模型预测误差明显低于单个模型或随机森林模型,证实了组合模型在中国碳排放量预测方面的优越性,能够为政府提供精准的中国未来碳排放量预测值,为今后碳排放额的制定起到指导作用,为中国对国际社会承诺碳减排数量起到参考作用。

【相关文献】

[1] BRIAN O’Neil,DATON Demographic Trends and Future Carbon

Emissions[J].PNAS,2010,107(41):17521-17526

[2] 李岩岩.ARIMA模型在重庆市能源消耗量预测中的应用[J].重庆工商大学学报(自然科学版),2015,32(8):54-60

LI Y ation of ARIMA Model in the Prediction of Energy Consumption of

Chongqing[J].Journal of Chongqing Technology and Business University(Natural Science

Edition),2015,32(8):54-60

[3] KHASHEI M,BIJARI M,ARDALI ement of Auto-regressive Integrated Moving

Average Models Using Fuzzy Logic and Artificial Neural

Networks[J].Neurocomputing,2009(72):956-967

[4] KAASTRA,BOYD ing a Neural Network for For-ecasting Financial and

Economic Time-series[J].Neurocomputing,1996(10):215-236

[5] DIORDANO F,LA ROCCA M,PERNA sting Nonlinear Time Series with Neural

Network Sieve Bootstrap[J].Comput Stat Data Anal,2007(51):3871-3884

[6] ZHANG G Series Forecasting Using a Hybrid ARIMA and Neural Network

Model[J].Neurocomputing,2003(50):159-175

[7] 王鑫,肖枝洪. 基于干预模型与BP神经网络集成的GDP预测[J]. 统计与决策,2012(20):141-144

WANG X X,XIAO ZH tion of GDP Based on BP and Intervention Model[J].Statistics

& Decision,2012(20):141-144

[8] 肖枝洪,郭明月.时间序列分析与SAS应用[M].武汉:武汉大学出版社,2012

XIAO ZH H,GUO M Series Analysis and SAS Application[M].Wuhan:Wuhan

University Press,2012

[9] CHEN Y,YANG B,DONG J,et -series Forecasting Using Flexible Neural Tree

Model[J].Inf Sci,2005,174(3):219-235

[10] 唐建荣,陈实.基于随机森林方法的碳足迹及其影响因素研究[J].统计与信息论坛,2013,28(10):70-74

TANG J R,CHEN on the Impact Factors of Carbon Footprint Based on Random

Forest[J].Statisitice & Information Forum,2013,28(10):70-74


更多推荐

模型,排放量,预测,中国,组合,进行,序列,数据