多元线性回归模型案例分析
——中国人口自然增长分析
一·研究目的要求
中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。
影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率
作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1):
表1 中国人口增长率及相关数据
年份 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
人口自然增长率
(%。) 15.73 15.04 14.39 12.98 11.6 11.45 11.21 10.55 10.42 10.06 9.14 8.18 7.58 6.95 6.45 6.01 5.87 5.89 5.38 国民总收入(亿元) 15037 17001 18718 21826 26937 35260 48108 59811 70142 78061 83024 88479 98000 108068 119096 135174 159587 184089 213132 居民消费价格指数增长
率(CPI)% 18.8 18 3.1 3.4 6.4 14.7 24.1 17.1 8.3 2.8 -0.8 -1.4 0.4 0.7 -0.8 1.2 3.9 1.8 1.5 人均GDP(元) 1366 1519 1644 1893 2311 2998 4044 5046 5846 6420 6796 7159 7858 8622 9398 10542 12336 14040 16024
设定的线性回归模型为:
Yt??1??2X2t??2X3t??3X4t?ut
三、估计参数
利用EViews估计模型的参数,方法是:
1、建立工作文件:启动EViews,点击File\\New\\Workfile,在对
话框“Workfile Range”。在“Workfile frequency”中选择“Annual” (年度),并在“Start date”中输入开始时间“1988”,在“end date”中输入最后时间“2005”,点击“ok”,出现“Workfile UNTITLED”工作框。其中已有变量:“c”—截距项 “resid”—剩余项。在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。
2、输入数据:点击“Quik”下拉菜单中的“Empty Group”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。用同样方法在对应的列命名X2、X3、X4,并输入相应的数据。或者在EViews命令框直接键入“data Y X2 X3 X4 … ”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。
3、估计参数:点击“Procs“下拉菜单中的“Make Equation”,在出现的对话框的“Equation Specification”栏中键入“Y C X2 X3 X4”,在“Estimation Settings”栏中选择“Least Sqares”(最小二乘法),点“ok”,即出现回归结果: 表3.4
根据表3.4中数据,模型估计的结果为:
Yt?15.60851?0.000332X2?0.047918X3?0.005109X4
(0.913842) (0.000134) (0.033919) (0.001771)
? t= (17.08010) (2.482857) (1.412721) (-2.884953)
2 R?0.930526 R?0.915638 F=62.50441
2四、模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长0.047918%;在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005109%。这与理论分析和经验判断相一致。
2、统计检验
2R(1)拟合优度:由表3.4中数据可以得到:?0.930526 ,修正
的可决系数为R2?0.915638,这说明模型对样本的拟合很好。
(2)F检验:针对H0:?2??3??4?0,给定显著性水平??0.05,在F分布表中查出自由度为k-1=3和n-k=14的临界值F?(3,14)?3.34。由表3.4中得到F=62.50441 ,由于F=62.50441 >F?(3,21)?3.075,应拒绝原假设H0:?2??3??4?0,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显著影响。
?j?0(j?1,2,3,4),(3)t 检验:分别针对H0:给定显著性水平??0.05,
查t分布表得自由度为n-k=14临界值t?/2(n?k)?2.145。
由表3.4中数据可得,与?1、?2、?3、?4对应的t统计量分别为17.08010、2.482857 、1.412721、-2.884953
^^^^ 除?3,其绝对值均大于t?/2(n?k)?2.145,这说明分别都应当拒
?0(j?1,2,4)?Hj绝0:,也就是说,当在其它解释变量不变的情况下,
^解释变量“国民总收入”、“人均GDP”分别对被解释变量“人口自然增长率”Y都有显著的影响。
?0?t?/2(n?k)?2.145H?303的绝对值小于,:这说明接受:,
^X3系数对t检验不显著,这表明很可能存在多重共线性。 所以计算各解释变量的相关系数,选择X2、X3、X4数据,
点”view/correlations”得相关系数矩阵(如表4.4):
表4.4
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 五、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4的一元回归,结果如表4.5所示:
表4.5
变量 参数估计值 t 统计量
X2 X3 0.033919 1.412721 0.388495 X4 0.001771 -2.88495 0.886412 0.000134 2.482857 0.873915 按R2的大小排序为:X4、X2、X3
以X2为基础,顺次加入其他变量逐步回归。首先加入X2回归结果为:
??16.35540?0.000350X2?0.0005397X4 Y2 t=(2.542529) (-2.970874) R?0.920622
当取??0.05时,?/2著,加入X3回归得
?t(n?k)?t0.025(18?3)?2.131,X2参数的t检验显
Yt?15.60851?0.000332X2?0.047918X3?0.005109X4
t= (17.08010) (2.482857) (1.412721) (-2.884953)
2 R?0.930526 R?0.915638 F=62.50441
2 当取??0.05时, t?/2(18?4)?2.145,X3参数的t检验不显著,予以剔除
??16.35540?0.000350X2?0.0005397X4,这是最后消除多重共线性 即Y的结果。
在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005109%。
金服131 王亚平
13019122