线性回归中的相关系数
Document number:NOCG-YUNOO-BUYTT-UU986-1986UT
线性回归中的相关系数
山东 胡大波
线性回归问题在生活中应用广泛,求解回归直线方程时,应该先判断两个变量是否是线性相关,若相关再求其直线方程,判断两个变量有无相关关系的一种常用的简便方法是绘制散点图;另外一种方法是量化的检验法,即相关系数法.下面为同学们介绍相关系数法. 一、关于相关系数法
统计中常用相关系数r来衡量两个变量之间的线性相关的强弱,当xi不全为零,yi也不全为零时,则两个变量的相关系数的计算公式是: r就叫做变量y与x的相关系数(简称相关系数).
说明:(1)对于相关系数r,首先值得注意的是它的符号,当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;
,?0.75?,那么负相关 (2)另外注意r的大小,如果r??0.751?,那么正相关很强;如果r???1,?0.30?或r??0.30,0.75?,那么相关性一般;如果r???0.25,0.25?,那么相关性较很强;如果r???0.75,弱.
下面我们就用相关系数法来分析身边的问题,确定两个变量是否相关,并且求出两个变量间的回归直线. 二、典型例题剖析
例1 测得某国10对父子身高(单位:英寸)如下:
父亲 身高(x) 儿子 身高(y) 64 66 74 70 60 62 65 66 67 68 70 72 (1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)如果父亲的身高为73英寸,估计儿子身高.
解:(1)x?66.8,y?67,?x?44794,?yi2?44929.22,xy?4475.6,x?4462.24,
2ii?1i?110102y?4489,?xiyi?44836.4,
i?1210 所以r??xyii?11010i?nxyn22???2x?nxyi2?ny???i???i?1???i?1????
?80.46730.152?80.4?0.98, 82.04 所以y与x之间具有线性相关关系.
(2)设回归直线方程为y?a?bx,则b??xyii?11010i?10xy?10x2??xi?12i44836.4?44756?0.4685,
44794?44622.4a?y?bx?67?0.4685?66.8?35.7042.
故所求的回归直线方程为y?0.4685x?35.7042. (3)当x?73英寸时,y?0.4685?73?35.7042?69.9047, 所以当父亲身高为73英寸时,估计儿子的身高约为英寸.
点评:回归直线是对两个变量线性相关关系的定量描述,利用回归直线,可以对一些实际问题进行分析、预测,由一个变量的变化可以推测出另一个变量的变化.这是此类问题常见题型. 例2 10名同学在高一和高二的数学成绩如下表:
74 71 72 68 76 73 67 70 65 74 76 75 71 70 76 79 65 77 62 72 其中x为高一数学成绩,y为高二数学成绩. (1)y与x是否具有相关关系;
(2)如果y与x是相关关系,求回归直线方程. 解:(1)由已知表格中的数据,利用计算器进行计算得
?xi?110i?710,?yi?723,x?71,y?72.3,?xiyi?51467.
i?1i?12i1010?xi?110?50520,?yi2?52541.
i?110