变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下:
A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如
lny?9.932?0.421lnx6 (0.116) (0.026)R2?0.926 R2?0.922 F?261.551
B:进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作lnY对ln X1,lnX2,lnX3,lnX4,lnX5,lnX6,lnX7的一元回归,结果如下:一元回归结果:
其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:
R2 经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显着,但是lnX5参数的符号与经济意义不符合。若再加入其他变
量后的逐步回归,若剔除不显着的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。 如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。 例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。作逐步回归: 分别作一元回归得到:
以X1为基础加入其他变量, 结果为:
R2 R 2 R2 注: 括号中为p值.
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显着。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为,在10%的显着性水平下是显着的。所以相对较为合理的模型估计结果可以为:
在本章开始的“引子”提出的“农业的发展反而会减少财政收入吗”的例子中,如果所采用的数据如下表所示
表 1978-2007年财政收入及其影响因素数据
试分析:为什么会出现本章开始时所得到的异常结果怎样解决所出现的问题 练习题参考解答:
(1)根据样本数据得到各解释变量的样本相关系数矩阵如下: 样本相关系数矩阵
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在以上。这显然与第三章对模型的无多重共线性假定不符合。 (2)解决方案:
采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。 合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减低共线性。
计量经济学第四章练习试题和参考解答



