应用回归分析讲义---十三
岭回归
一、岭回归的引入 二、岭回归的SPSS程序
三、岭回归参数K的选取,参数粗估计,参数精估计,确定参数模型 四、岭回归模型的应用
1962年由A.E.Feorl提出,R.W.Kennard在1970年发展的岭回归(Ridge regression),
回归系数的有偏估计—岭回归
??1??(X'X)X'y''
?1当XX?0,为了(XX)定义??(X'X?KIP)K称为岭参数
存在且稳定,
?1X'YK=0时为最小二乘估计,K>0,小于1。K从0到1逐渐增大,选择一个最合适的K值。
岭回归用于解决模型的自变量共线性问题。
P92
YEAR 1987 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 Y 231.00 298.00 343.00 401.00 445.00 391.00 554.00 744.00 997.00 1310.00 1442.00 1283.00 1660.00 2178.00 2886.00 3383.00 X1 3010.00 3350.00 3688.00 3941.00 4258.00 4736.00 5652.00 7020.00 7859.00 9313.00 11738.00 13176.00 14384.00 16557.00 20223.00 24882.00 X2 1888.00 2195.00 2531.00 2799.00 3054.00 3358.00 3905.00 4879.00 5552.00 6386.00 8038.00 9005.00 9663.00 10969.00 12985.00 15949.00 X3 81491.00 86389.00 92204.00 95300.00 99922.00 106044.0 110353.0 112110.0 108579.0 112429.0 122645.0 113807.0 95712.00 95081.00 99693.00 105458.0 X4 14.89 16.00 19.53 21.82 23.27 22.91 26.02 27.72 32.43 38.91 37.38 47.19 50.68 55.91 83.66 96.08 X5 180.92 420.39 570.25 776.71 792.43 947.70 1285.22 1783.30 2281.49 2690.23 3169.48 2450.14 2746.20 3335.65 3311.50 4152.70 建立回归模型,共线性诊断 1、VIF,容忍度,条件指数,
2、变量X2的系数为负值,经济理论认为应为正相关。说明共线性造成后果。
进行岭回归分析
一、 岭迹
模型系数随参数K变化的曲线
岭迹图
根据岭迹确定K。 K=0时表示古典回归
二、 岭回归根据岭迹图确定 参数K P193
图A,系数趋于0,变量不重要
图B.系数由正变负,变化大,对Y有显著影响 图C. 古典模型时系数为正,岭回归时系数为负.
图D. 两个系数不稳定,一个增大时另一个减少, 但其和稳定,可以考虑保留一个变量. 图E. 变量对Y不显著 图F. 变量对Y的影响趋于稳定
选择标准:
1、 各回归系数基本稳定
2、 用最小二乘法时不合理的系数用岭回归变得合理