.-
(2)近似共线性下OLS估计量非有效,多重共线性使参数估计值的方差增大,
1/(1?r2)为方差扩大因子(Variance Inflation Factor, VIF)
(3)参数估计量经济含义不合理
(4)变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外 (5)模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。
方程的异方差、自相关以及多重共线性诊断 1.异方差诊断
这里使用等级相关系数法检验,计算残差绝对值|ei|(见附录2)与自变量xi的相关性时采用Spearman等级相关系数,而不采用Pearson简单相关系数,这是由于等级相关系数可以反映非线性相关的情况,而简单相关系数不能如实反映非线性相关情况。
相关性 Unstandardized Residual 储蓄存款年底余额 Unstandardized Residual Pearson 相关性 显著性(双侧) N 1 .023 .923 21 .023 .923 21 21 1 储蓄存款年底余额 Pearson 相关性 显著性(双侧) N 21 残差绝对值与自变量储蓄存款年底余额x1的相关系数为rs=0.023
相关性 Unstandardized Residual 储蓄存款年增加额 Unstandardized Residual Pearson 相关性 显著性(双侧) 1 .121 .601 .-
N 储蓄存款年增加额 Pearson 相关性 显著性(双侧) N 21 .121 .601 21 21 1 21
残差绝对值与自变量储蓄存款年增加额x2的相关系数为rs=0.121
相关性 Unstandardized Residual 国民总收入 1 .047 .839 21 .047 .839 21 21 1 Unstandardized Residual Pearson 相关性 显著性(双侧) N 国民总收入 Pearson 相关性 显著性(双侧) N 21 残差绝对值与自变量国民总收入x3的相关系数为rs=0.047
相关性 Unstandardized Residual 就业情况 1 -.281 .218 21 -.281 .218 21 21 1 Unstandardized Residual Pearson 相关性 显著性(双侧) N 就业情况 Pearson 相关性 显著性(双侧) N 21 残差绝对值与自变量就业情况x4的相关系数为rs=-0.281
.-
相关性 Unstandardized Residual 家庭恩格尔系数 1 .183 .427 21 .183 .427 21 21 1 Unstandardized Residual Pearson 相关性 显著性(双侧) N 家庭恩格尔系数 Pearson 相关性 显著性(双侧) N 21 残差绝对值与自变量家庭恩格尔系数x5的相关系数为rs=-0.183
因为在显著性水平??0.05下,每个p值都大于??0.05,认为残差绝对值|ei|与自变量xi不显著相关,即认为不存在异方差。 2.自相关诊断
这里我们采用DW检验。可以用SPSS算出DW的值,结果如下
模型汇总b 模型 1 R .999a R 方 .999 调整 R 方 标准 估计的误差 .999 212.39403 Durbin-Watson 1.892 a. 预测变量: (常量), 家庭恩格尔系数, 储蓄存款年增加额, 就业情况, 国民总收入, 储蓄存款年底余额。 b. 因变量: 可支配收入 由表5我们可以得到DW=1.892,查DW表,n=21,k=6,显著性水平??0.05,得
dL?0.83,dU?1.96。由0?DW?dL,可知残差是有自相关。 消除自相关
这里我们用迭代法消除自相关,需要求出yt?和xi?,t,其中
?yt??yt??yt?1 i?1,2,?,5 (5.3) ??x?x??xi,tt?1?i,t.-
1??1-DW来估计?,(5.3)式中自相关系数?是未知的,用?计算出?后,
2带入(5.3)式,计算变换因变量yt?和变换自变量xi?,t(见附录1),然后用变换得到自变量和因变量作普通最小二乘回归,看看自相关是否消除。
模型汇总b 模型 1 R 1.000a R 方 .999 调整 R 方 标准 估计的误差 .999 218.21364 Durbin-Watson 1.782 a. 预测变量: (常量), x53, x23, x43, x33, x13。 b. 因变量: y3
由表6我们可以得到DW=1.782,查DW表,n=20,k=6,显著性水平??0.05,得
dL?0.79,dU?1.99。由dL?DW?dU,可知不能判定残差是否有自相关。
多重共线性诊断
这里采用方差扩大因子和条件数检验回归方程的多重共线性。方差扩大因子法中,当VIFj?10时,就说明自变量xj与其与自变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。条件数法中,当0?k?10时,没有多重共线性;10?k?100时,存在较强的多重共线性;k?100时,存在严重的多重共线性
系数a B 的 95.0% 置信区非标准化系数 标准 误模型 1 (常量) 储蓄存款年底余额 B 差 试用版 t -1.430 .457 Sig. 下限 上限 容差 VIF 标准系数 间 共线性统计量 -4471.278 3126.013 .004 .008 .060 .173 -11134.218 2191.662 .654 -.013 .020 .004 259.650 .-
储蓄存款年增加额 国民总收入 就业情况 家庭恩格尔系数 a. 因变量: 可支配收入 .011 .010 .027 1.084 .296 -.010 .032 .110 9.083 .036 .102 -7.248 .005 .021 33.502 .806 .127 -.008 7.156 4.817 -.216 .000 .000 .832 .025 .057 -78.656 .047 .147 64.161 .005 189.802 .096 .046 10.428 21.690 可以看出储蓄存款年底余额(x1)国民总收入(x3)的方差扩大因子很大,分别为,远远超过10,说回归方程存在着严重的多重共VIF1?259.650,VIF3?189.802,线性。
消除多重共线性
变量之间的多重共线性比较严重,我们先用逐步回归的方法剔除一些变量。用普通最小二乘回归对迭代法得到的数据进行分析
系数a 非标准化系数 标准 误模型 1 (常量) 储蓄存款年底余额 储蓄存款年增加额 国民总收入 就业情况 家庭恩格尔系数 a. 因变量: 可支配收入 .036 .102 -7.248 .005 .021 33.502 .806 .127 -.008 7.156 4.817 -.216 .000 .000 .832 .025 .057 -78.656 .047 .147 64.161 .005 189.802 .096 .046 10.428 21.690 .011 .010 .027 1.084 .296 -.010 .032 .110 9.083 B 差 试用版 t -1.430 .457 Sig. 下限 上限 容差 VIF 标准系数 B 的 95.0% 置信区间 共线性统计量 -4471.278 3126.013 .004 .008 .060 .173 -11134.218 2191.662 .654 -.013 .020 .004 259.650 可以看出储蓄存款年底余额(x1)的方差扩大因子VIF1?259.650最大,应该剔除变