基于ARIMA和二次指数平滑模型的人口组合预测
张 祎a,朱家明b*
【摘 要】以年末人口总数为指标,分析近年来的人口增长现状.建立ARIMA(3,3,1)模型、二次指数平滑模型和组合预测模型三个模型,拟合近30年的年末总人口数,用组合预测法预测未来4年的年末总人数,得出两种模型的最优系数分别为0.25和0.75.研究结果表明,未来4年年末总人口数仍会增长,但年增长率会逐年降低.
【期刊名称】牡丹江师范学院学报(自然科学版) 【年(卷),期】2017(000)001 【总页数】4
【关键词】ARIMA模型;二次指数平滑模型;组合预测模型;年末人口总数 人口总数预测预测模型方法有ARIMA模型、logisitic模型、指数平滑模型、灰色预测模型等.胡冬梅[1]采用ARIMA模型,将数据取对数后再做二阶差分建立ARMA模型,对内蒙古的常住人口进行短期预测;王泽旻等[2]建立灰色预测模型,对全国人口总数进行预测.笔者综合了ARIMA(3,1,1)模型,从人口发展的历史规律进行分析,根据二次指数平滑模型对时间序列数据厚近薄远的特性,利用组合预测法得出以下结论:未来4年的人口虽然呈现一定上升趋势,但年增长率会逐年降低.
1 数据来源及指标建立
以中国统计局网站提供的1985-2014年间的年末人口总数指标值为样本,建立“预测误差平方和”指标.假设xt为第t年的人口总数实际值,t为第t年的人口总数预测值,取最后16期值为样本,则预测误差平方和
.
若z值较大,说明误差比较大,则模型选用较差,反之选用模型较好.
2 ARIMA模型
2.1 数据平稳性检验
采用ADF方法序列是否具有单位根进行检验.原序列在95%的置信水平下接受原假设,序列非平稳,原序列具有很强的趋势性.为了减缓趋势性,对原序列进行一阶差分处理,并对差分后的序列进行ADF单位根检验,P=0.003 4.在5%的显著性水平下,进行差分后的序列是平稳的,可以进行下一步的研究. 检验结果表明,差分后的序列平稳.由于Q统计量的伴随概率P值小于0.05,所以可以认为在5%的显著性水平下拒绝原假设,说明至少存在某个滞后期的自相关系数显著非0,也即拒绝原假设,序列非白噪声,原序列是1阶单整序列.
2.2 模型的定阶
将模型设定为ARIMA(p,1,q),通过自相关与偏自相关系数确定p与q值.由于自相关系数滞后3阶截尾,偏自相关系数滞后1阶截尾.将模型设定为ARIMA(3,1,1),在进行线性最小二乘估计的过程中,由于ar(1)和ar(2)的显著性检验不通过,去掉这两项,再进行拟合.Adjusted R-squared为0.946 2,说明模型的拟合效果较好,可以解释序列94.62%的变动.赤池信息量准则AIC为9.6,施瓦兹准则SC为9.75,DW在2附近,可以认为随机误差项无序列相关问题.
对模型进行诊断检验,P值小于5%,即在95%的置信水平下通过显著性检验,系数显著; 残差序列的Q统计量的P值都显著大于0.05,可以认为残差序列
是一个随机的序列,说明模型拟合良好,已经充分提取了时间序列中的有用信息.综上,建立ARIMA(3,1,1)模型 (1-B)yt=655.99+0.49yt-3+0.85εt-1. 2.3 未来4年的年末人口总数预测
选用静态预测,通过ARIMA(3,1,1)模型预测未来4年的年末人口总数,拟合效果较好.
为了检验模型的效果,取实际年末总人口数的最后16个与预测值进行对比,采用Static forecast,得到预测的最后的16个数值与真实值的误差平方和为201 695.43.
3 指数平滑模型
指数平滑法计算量小,容易掌握,操作简单,因此广泛用于经济研究的各个领域,在短期人口问题预测中,预测期近的数据相对于离预测期远的数据对预测值的影响更大,应当占有更大的比重,因此在指数平滑法中可以选择一个平滑系数α(0<α<1)来反映不同的衰减快慢速度.二次指数平滑法实质上是对一次指数平滑值再做一次指数平滑,是将各滞后期的数据进行加权平均作为未来值,克服了一次指数平滑法无法对明显变动趋势的现象进行预测的缺陷. 线性二次指数平滑法的公式为: ,
各自代表t期和t-1期的二次指数平滑所得的未来值,为t期的一次指数平滑值,a为平滑系数.在给定 和的条件下,利用该模型进行预测的公式为: ,
其中,T为预测超前期数.