好文档 - 专业文书写作范文服务资料分享网站

应用回归课程教学设计

天下 分享 时间: 加入收藏 我要投稿 点赞

.-

?,??,??,?,??满足 ?012p Q(?0,?1,?2,?,?p)??(yi??0??1xi1??2xi2????pxip)2

i?1n ?(y???min????i0,1,2?n20??1xi1??2xi2????pxip)

,pi?1(4.13)

?,??,??,?,??就称为回归参数?,?,?,?,?的最小二依照(4.13)式求出的?012p012p乘估计。

????x???x?????x (4.14) ??? y01122pp为经验回归方程。

(四)问题分析

①数据说明

以1991年-2011年的城镇居民家庭人均可支配收入y为因变量,选取城乡居民储蓄存款年底余额x1、城乡居民储蓄存款年增加额x2、国民总收入x3、职工基本就业情况x4、城镇居民家庭恩格尔系数(%)x5为自变量。数据来源国家统计局网站统计年鉴。

.-

②求解分析

直接进入法

模型汇总 模型 1 R .999a R 方 .999 调整 R 方 标准 估计的误差 .999 212.39403 a. 预测变量: (常量), 家庭恩格尔系数, 年增加额, 就业情况, 国民总收入, 年底余额。

可以看出调整后的决定系数R2?0.999,说明回归方程的拟合优度比较好。

.-

Anovab 模型 1 回归 残差 总计 平方和 6.745E8 676668.353 6.752E8 df 5 15 20 均方 1.349E8 45111.224 F 2990.552 Sig. .000a a. 预测变量: (常量), 家庭恩格尔系数, 年增加额, 就业情况, 国民总收入, 年底余额。 b. 因变量: 可支配收入 方差分析表可以看出,F检验的检验值F=2990.552非常大,再看F检验的P值

?0.000,可知此回归方程高度显著,即做出5个自变量整体对因变量y产生显

著线性影响的判断所犯错误的概率仅为0.000。

系数a 非标准化系数 模型 1 (常量) 储蓄存款年底余额 储蓄存款年增加额 国民总收入 就业情况 家庭恩格尔系数 a. 因变量: 可支配收入 B -4471.278 .004 .011 .036 .102 -7.248 标准 误差 3126.013 .008 .010 .005 .021 33.502 标准系数 试用版 t -1.430 .060 .027 .806 .127 -.008 .457 1.084 7.156 4.817 -.216 Sig. .173 .654 .296 .000 .000 .832 B 的 95.0% 置信区间 下限 -11134.218 -.013 -.010 .025 .057 -78.656 上限 2191.662 .020 .032 .047 .147 64.161

此时得到的回归方程为:

y??4471.278?0.004x1?0.011x2?0.036x2?0.102x3?7.248x4

?复决定系数为0.999,F-检验高度显著(F=2990.552,P=0.000),说明模型整体拟合效果不错。

首先看t检验结果, ?j的t统计量tj(j?1,2,?,5)及其相应的p值就是上表第五

.-

列(Sig.)的结果。我们可以发现显著性水平??0.05时只有国民总收入(x3)和就业情况(x4)通过了显著性检验。尽管回归方程的显著性检验高度显著,但也会出现有某些自变量xj(甚至每个xj)对y无显著影响的情况。

接着看看回归系数的置信区间除了有国民总收入(x3)系数95%置信区间[0.025,0.047]和就业情况(x4)系数95%置信区间[0.057,0.147]不包含0,这也反映了回归系数的不合理。

那么究竟是什么原因导致回归方程出现上述结果呢,我们猜想可能是下列原因导致的。

(1)异方差和自相关

在回归模型的基本假设中,假定随机误差性?1,?2,?,?n具有相同的方差,独立或不相关,即对于所有样本点,有

E(?i)?0,i?1,2,?,n??2?cov(?,?)???,i?ji,j?1,2,?,n

?ij??0,i?j?但在建立实际问题的回归模型时,经常存在于此假设相违背的情况,一种是计量经济建模中常说的异方差性,即var(?i)?var(?j),当i?j时另一种是自相关性,即

cov(?i,?j)?0,当i?j时,异方差带来的问题:

当一个回归问题存在异方差时,如果仍用普通最小二乘发估计位置参数,将引起不良后果,特别是最小二乘估计量不再具有最小方差的优良性,即最小二乘估计的有效性被破坏了。

?的方差大于在同方差条件下的方差,如果用普通最当存在异方差时,参数向量??的真是方差的情况,进一步将导致高估回归系小二乘发估计参数,将出现低估?数的t检验值,可能造成本来不显著的某些回归系数变成显著。这将给回归方程的应用效果带来一定影响。

当存在异方差是,普通最小二乘估计存在以下问题:

1、参数估计值虽然是无偏的,但不是最小方差线性无偏估计。 2、参数的显著性检验失效。 3、回归方程的应用效果极不理想。

.-

自相关带来的问题:

当一个线性回归模型的随机误差项存在序列相关时,就违背了线性回归方程的基本假设,如果仍然直接用普通最小二乘法估计未知参数,将会产生严重后果,一般情况下,序列自相关性会带来下列问题: 1、最小二乘估计量仍然是线性的和无偏的。

2、最小二乘估计量不是有效的,即OLS估计量的方差不是最小的,估计量不是最优线性无偏估计量(BLUE)。

3、OLS估计量的方差是有偏的。用来计算方差和OLS估计量标准误的公式会严重的低估真实的方差和标准误,从而导致t值变大,使得某个系数表面上显著不为零,但事实却相反。

4、t检验和F检验不是可信的。

5、计算得到的误差方差?2=SSE/df(残差平方和/自由度)是真实?2的有偏估计量,并且很可能低估了真实的?2。 6、计算的R2也不能真实的反映实际R2。 7、计算的预测方差和标准误差通常是无效的。 (2)多重共线性

多元线性回归有一个基本假设,就是要求设计矩阵X的秩rank(X)?p?1,即要求X中的列向量之间线性无关。如果存在不全为零的p?1个数

c0,c1,c2,?,cp,使得

c0?c1xi1?c2xi2???cpxip?0, i?1,2,?,n (5.1)

则自变量x1,x2,?,xp之间存在完全多重共线性。在实际问题中,完全的多重共线性并不多见,常见的是(5.1)式近似成立的情况,即存在不全为零的p?1个数

c0,c1,c2,?,cp,使得

c0?c1xi1?c2xi2???cpxip?0, i?1,2,?,n (5.2)

当自变量x0,x1,x2,?,xp存在(5.2)式的关系时,称自变量x0,x1,x2,?,xp之间存在多重共线性(multi-collinearity),也称为复共线性。 多重共线性到来的影响:

(1)完全共线性下参数估计量不存在

应用回归课程教学设计

.-?,??,??,?,??满足?012pQ(?0,?1,?2,?,?p)??(yi??0??1xi1??2xi2????pxip)2i?1n?(y???min????i0,1,2?n20??1xi1??2xi2????pxip),pi?1(4.13)
推荐度:
点击下载文档文档为doc格式
070fr055qp9da6a52gje3fmdy9ulfu00gf8
领取福利

微信扫码领取福利

微信扫码分享