经典线性回归模型
经典回归模型在涉及到时间序列时,通常存在以下三个问题:
1)非平稳性→ ADF单位根检验→ n阶单整 → 取原数据序列的n阶差分(化为平稳序列) 2)序列相关性→D.W.检验/相关图/Q检验/LM检验→n阶自相关→自回归ar(p)模型修正 3)多重共线性→相关系数矩阵→逐步回归修正 注:以上三个问题中,前两个比较重要。
整体回归模型的思路:
1)确定解释变量和被解释变量,找到相关数据。数据选择的时候样本量最好多一点,做出来的模型结果也精确一些。
2)把EXCEL里的数据组导入到Eviews里。 3)对每个数据序列做ADF单位根检验。 4)对回归的数据组做序列相关性检验。 5)对所有解释变量做多重共线性检验。 6)根据上述结果,修正原先的回归模型。 7)进行模型回归,得到结论。
Eviews具体步骤和操作如下。
一、数据导入
1)在EXCEL中输入数据,如下:
除去第一行,一共2394个样本。
2)Eviews中创建数据库:
File\\new\\workfile, 接下来就是这个界面(2394就是根据EXCEL里的样本数据来),OK
3)建立子数据序列 程序:Data x1
再enter键就出来一个序列,空的,把EXCEL里对应的序列复制过来,一个子集就建立好了。X1是回归方程中的一个解释变量,也可以取原来的名字,比如lnFDI,把方程中所有的解释变量、被解释变量都建立起子序列。
二、ADF单位根检验
1)趋势。打开一个子数据序列,先判断趋势:view\\graph,出现一个界面,OK。
得到类似的图,下图就是有趋势的时间序列。
X1.4.2.0-.2-.4-.6-.810002000300040005000 2)ADF检验。直接在图形的界面上进行操作,view\%unit root test,出现如下界面。
在第二个方框内根据时序的趋势选择,Intercept指截距,Trend为趋势,有趋势的时序选择第二个,OK,得到结果。
上述结果中,ADF值为-3.657113,t统计值小于5%,即拒绝原假设,故不存在单位根。若大于5%,则存在单位根。按照这个做法将所有的序列都操作一遍。 3)修正。倘若原序列存在单位根,就对原序列进行一阶差分。 程序:genr dx1=D(x1)
Enter键后,Eviews里会自动生成子序列dx1,x1只是解释变量,可以自己命名。再对该一阶差分序列进行ADF检验,若所得均显著,即为一阶单整序列,此序列不存在单位根。按照一阶单整序列建立模型,模型的数据序列是平稳的。
三、模型回归
程序:data y x1 x2
Y是模型的被解释变量,后面的解释变量随模型的具体情况而定。 Enter键,出来一个数据组合,我这里DX11做为被解释变量。
接下来是回归的操作。
点击Proc/make equation,出来界面,直接点确定。其中,dx11是被解释变量,其余都为解释变量。
得到结果,形式如下。
结果说明:coefficient是每个解释变量对应的系数,第四列是t统计值,最后一列是伴随概率。R-squared是拟合优度,下面那个是调整的拟合优度。 分析时遵循下列原则: <1>模型总体拟合优度R2,一般而言50%以上就很好。这个说明的是方程解释变量总体对被解释变量的解释力度好,即你的模型建立的比较正确。F值和此类似,判断方法和t统计值的一样,看伴随概率。
<2>系数。看t值和伴随概率,如果伴随概率小于自己设定的显著性水平(1%、5%、10%),则拒绝原假设,说明该一个解释变量对被解释变量有显著的贡献度。 注:R2看的是整体(所有解释变量),t注重的是单个解释变量的贡献度。
四、序列相关性检验