好文档 - 专业文书写作范文服务资料分享网站

线性回归方程中的相关系数r 

天下 分享 时间: 加入收藏 我要投稿 点赞

线性回归方程中的相关系数r

r=∑(Xi-X的平均数)(Yi-Y平均数)/根号下[∑(Xi-X平均数)^2*∑(Yi-Y平均数)^2]

R2就是相关系数的平方,

R在一元线性方程就直接是因变量自变量的相关系数,多元则是复相关系数 判定系数R^2

也叫拟合优度、可决系数。表达式是: R^2=ESS/TSS=1-RSS/TSS

该统计量越接近于1,模型的拟合优度越高。

问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。

——但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。

这就有了调整的拟合优度: R1^2=1-(RSS/(n-k-1))/(TSS/(n-1))

在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响: 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。

总是来说,调整的判定系数比起判定系数,除去了因为变量个数增加对判定结果的影响。 R = R接近于1表明Y与X1, X2 ,…, Xk之间的线性关系程度密切; R接近于0表明Y与X1, X2 ,…, Xk之间的线性关系程度不密切

相关系数就是线性相关度的大小,1为(100%)绝对正相关,0为0%,-1为(100%)绝对负相关

相关系数绝对值越靠近1,线性相关性质越好,根据数据描点画出来的函数-自变量图线越趋近于一条平直线,拟合的直线与描点所得图线也更相近。

如果其绝对值越靠近0,那么就说明线性相关性越差,根据数据点描出的图线和拟合曲线相差越远(当相关系数太小时,本来拟合就已经没有意义,如果强行拟合一条直线,再把数据点在同一坐标纸上画出来,可以发现大部分的点偏离这条直线很远,所以用这个直线来拟合是会出现很大误差的或者说是根本错误的)。 分为一元线性回归和多元线性回归 线性回归方程中,回归系数的含义 一元:

Y^=bX+a b表示X每变动(增加或减少)1个单位,Y平均变动(增加或减少)b各单位 多元:

Y^=b1X1+b2X2+b3X3+a 在其他变量不变的情况下,某变量变动1单位,引起y平均变动量

以b2为例:b2表示在X1、X3(在其他变量不变的情况下)不变得情况下,X2每变动1单位,y平均变动b2单位

就一个reg来说y=a+bx+e

a+bx的误差称为explained sum of square e的误差是不能解释的是residual sum of square 总误差就是TSS 所以TSS=RSS+ESS

判定系数也叫拟合优度、可决系数。表达式是

该统计量越接近于1,模型的拟合优度越高。

问题:在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大 这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。

——但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。

这就有了调整的拟合优度

在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。

总是来说,调整的判定系数比起判定系数,除去了因为变量个数增加对判定结果的影响。 顺便补充一下:

一般做回归的时候要求拟合优度(实际值与拟合值相关系数的平方)越高越好,可以通过增加解释变量来实现,可是解释变量多了后很多解释变量的系数T检验不显著了,而且增加很多变量后模型的自由度就减少了,这些情况狂的存在往往使得模型预测不精确;修正拟合优度就是将残差平方和跟总离差平方和分别除以各自的自由度,这样就剔除了变量个数对其影响了。

首先有一个恒等式:TSS = ESS + RSS

即 总偏差平方和 = 回归平方和 + 残差平方和

通常情况,我们都是讨论解释变量对总效应的贡献,使用一个叫“拟合优度”(或者叫“判定系数”)的指标 其定义为:

回归平方和 / 总偏差平方和 =ESS/TSS = (TSS-RSS)/TSS =(923-325)/923

如果说随机误差对总效应的贡献,那可以直接 RSS/TSS

因为 1 - (TSS-RSS)/TSS 就可以化为 RSS / TSS

线性回归方程中的相关系数r 

线性回归方程中的相关系数rr=∑(Xi-X的平均数)(Yi-Y平均数)/根号下[∑(Xi-X平均数)^2*∑(Yi-Y平均数)^2]R2就是相关系数的平方,R在一元线性方程就直接是因变量自变量的相关系数,多元则是复相关系数判定系数R^2也叫拟合优度、可决系数。表达
推荐度:
点击下载文档文档为doc格式
1qr8l9gc8u06i7l4fy11
领取福利

微信扫码领取福利

微信扫码分享