有关全国GDP的时间序列分析论文
摘要:时间序列指的是同一空间、不同时间某一现象的统计指标数值按时间先后顺序形成的一组动态序列。国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国力的重要指标。本文基于时间序列理论,以我国1978年至2014年三十六年的国内生产总值为基础,对数据进行平稳化处理、模型识别、模型估计、模型检验,确定较适合模型为自回归移动平均模型。之后利用ARIMA模型对我国2013—2014年GDP作出预测并与实际值比较,结果表明预测比较合理,预测模型良好,继续利用ARIMA模型对我国未来4年的国内生产总值做出预测。
关键词:时间序列;国内生产总值;ARIMA模型 前言
时间序列是将反映社会等现象的某一数量指标的观察数据按照时间顺序排列起来所形成的的序列。时间序列建模的完整过程包括模型识别、模型估计、模型检验和模型应用。时间序列分析的基本模型有:ARMA模型和ARIMA模型。时间序列分析预测法,首先将预测目标的历史数据按照时间先后的顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。 本文的主要工作是从《中国统计年鉴 2015》中选取我国1978 年2014年共36年的GDP作为数据,运用时间序列分析的基本的分析方法随机时序分析,进行模型识别、模型估计和模型检验,应用选定时间序列方法预测未来GDP。 1 ARIMA模型建模步骤 1.1 数据平稳化处理
首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF单位根检验来精确判断该序列的平稳性。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为ARIMA(p,d,q)模型中的阶数d。但应当注意的是,一般差分次数不超过2次。数据平稳化处理后,ARIMA(p,d,q)模型即转化为ARMA(p,q)模型。 1.2 模型识别
我们引入自相关系数和偏自相关系数这两个统计量来识别ARMA(p,q)模型的系数特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。 1.3 参数估计
确定模型阶数后,应对ARMA模型进行参数估计。本文采用最小二乘法OLS进行参数估计,需要注意的是,MA模型的参数估计相对困难,应尽量避免使用高阶的移动平均模型或包含高阶移动平均项的ARMA模型。 1.4 模型检验
完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检
验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。 2 实证分析
下面以我国1978—2014年国内生产总值数据为例,介绍用时间序列分析法对数据分析的过程,并通过其预测2014及2015两年的国内生产总值与实际的国内生产总值比较,选取最为合理的预测方法对未来4年我国GDP的做出预测。 2.1 我国GDP时间序列分析
在ARMA模型中,时间序列由一个零均值的平稳随机过程产生,即其具有时间上的不变性,在图形上表现为所有样本点都在某一水平线上下随机波动。对于非平稳时间序列,需要预先对时间序列进行平稳化处理。 2.1.1 平稳性检查
首先我们绘制原始GDP的时间序列图可以看出我国GDP具有很明显的上升趋势,可以看出原始序列显然是非平稳的。进一步进行ADF单位根检验,可以看出,检验未能通过,表明原始GDP序列是非平稳的。为了能够对序列进行分析,要使其平稳化。故将选择两种方法:取对数法和差分法,对序列进行平稳化处理,从而进一步分析预测。 2.1.2 平稳化处理
我们先对原始GDP数据进行对数化处理,对数处理后序列仍具有明显的上升趋势,进一步进行ADF单位根检验,我们可以看出此序列仍然是非平稳的。 下面我们对取对数后的序列y进行一阶差分,并验证其平稳性。
结果显示T统计量为-3.582639,p值为0.0119。从单位根检验可以看出T统计量均小于5%和10%下的检验值,且P值显著小于0.05,所以不存在单位根,所以我们可以确定一阶差分后序列平稳。因此可以确定ln(GDP)序列是一阶单整序列,即ln(GDP)~I(1)。 2.2 时间序列模型的建立
我们研究的序列为一元时间序列,建模的目的是利用其历史值和当前及过去的随机误差项对该变量变化前景进行预测,通常假定不同时刻的随机误差项为统计独立且正态分布的随机变量。对于时间序列预测,首先要找到与数据拟合最好的预测模型,所以阶数的确定和参数的估计是预测的关键。 2.2.1 模型识别
为了判断时间序列模型的类型,我们要计算出自相关函数和偏相关函数。得到Ln(GDP)一阶差分后自相关与偏自相关系数的图之后尝试建立模型,可知ARIMA(2,1,3)最优,如下图3-1
图3-1
2.2.2 模型检验
首先画出ARIMA(2,1,3)模型的残差序列图
之后得到ARIMA(2,1,3)模型的残差序列的自相关系数和偏自相关系数如图3-2:
图3-2 残差序列的自相关系数和偏自相关系数图
从残差序列图和残差序列的自相关系数和偏自相关系数的图可以看出所有的p值均大于0.05,因此残差已经没有相关性。所以残差序列为白噪声序列,即ARIMA(2,1,3)模型通过了检验。所以最终我们选择ARIMA(2,1,3)模型对我国GDP进行分析预测。即ARIMA(2,1,3)模型是本文最终所求的模型。
在前面的叙述中,我们已经得出了ARIMA(2,1,3)模型参数的估计图,这样就可以根据这个图中的数据得到我们想要估计的模型方程了。 所以由图得到ARIMA(2,1,3)模型为: 2.3 我国GDP短期预测及分析
我们利用ARIMA(2,1,3)模型对2013年—2014年Ln(GDP)预测,由此可计算得到我国2013年—2014年GDP值如下: 2013年—2014年GDP预测值与实际值比较:
2013年的预测值为506486.6亿元,实际值为588018.8亿元,相对误差为-13.87%
2014年的预测值为583247.8亿元,实际值为636138.7亿元,相对误差为-8.31%
由上面表可知,通过两年的预测值与实际值的比较,我们可以看出预测效果还合理。
因此,选择ARIMA(2,1,3)模型对我国未来4年的GDP作出预测: 表2 2015年—2018年我国GDP预测值
3 结语
本文使用时间序列分析的方法对我国国内生产总值的年度数据序列进行了随机性分析,并运用ARIMA模型预测方法对我国的国内生产总值进行了小规模的预测。通过模型识别、比较以及检验,最终选定ARIMA(2,1,3)模型,之后利用此模型对2015-2018年全国GDP进行了预测。
从该论文随机性分析的方法对时间序列做出分析和预测的结果中可以看出,取对数,对数据进行处理,然后适当的差分,选择适当的较低的模型阶数,可取得较为理想的预测结果。由本文得到的较为满意的拟和结果可知时间序列短期预测精度是比较高的。由此可见,时间序列预测法是一种重要的预测方法,其模型比较简单,只需变量本身的历史数据,在实际中有着广泛的适用性。在应用中,应该根据所要解决的问题及问题的特点等方面因素来综合考虑并选择相对最优的模型。当然,本文还有许多不足之处,会在以后的学习工作中将其不断完善。
参考文献
[1]王燕. 应用时间序列分析[M]. 北京:中国人民大学出版社,2005:1-239. [2]高铁梅. 计量经济分析方法与建模:EViews应用及实例[M]. 北京:清华大学出版社,2006:85-88.
[3]易丹辉. 统计预测2方法与应用[M]. 北京:中国统计出版社,2001:177-251. [4]中国统计年鉴2015
[5]赵蕾. ARIMA模型在福建省GDP预测中的应用[J],科技和产业,2007. [6]吴怀宇. 时间序列分析与综合[M]. 武汉大学出版社.2004:10-98.
[7]张晓峒.EViews使用指南与案例[M]. 北京:机械工业出版社,2007:78-89. [8]武文婕. ARIMA模型在GDP预测中的应用[J]. 中国科技信息,2007.