第六单元第3讲 变量间的相关关系与统计案例(3课时)
一基础知识 1.相关关系的分类
从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.
2.线性相关
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据: ^x+a^,则 (x1,y1),(x2,y2),…,(xn,yn),其回归方程为^y=b
b??xy?nxy?(x?x)(y?y)iiiii?1nnn?xi?12i?nx2?i?1?(x?x)ii?1n,a?y?bx
2其中,b是回归方程的斜率,a是在y轴上的截距. 4.样本相关系数
r=
?(xi?1ni?1ni?x)(yi?y)n??xyii?1n2i?1ni?nxyn,用它来衡量两个变量
2?(xi?x)2?(yi?y)2i?1(?xi2?nx)(?yi2?ny)i?1间的线性相关关系.
(1)当r>0时,表明两个变量正相关; (2)当r<0时,表明两个变量负相关;
(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. (4)相关性检验的步骤:
1
① 作统计假设
② 根据小概率0.05与n-2在附表中找出r的一个临界值r0.05 ③ 根据样本相关系数计算公式算出r值
④ 用统计判断,如果|r|?r0.05,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设. 如果|r|?r0.05,表明一个发生的概率不到5%的事件在一次试验中竟发生了.这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系.
5.线性回归模型
(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差. (2)相关指数 用相关指数
R2来刻画回归的效果,其计算公式是:
残差平方和22,R的值越大(接近1),R的值越大,说
总偏差平方和R2?1-?(y?(yi?1i?1nni?i)2?y?1??yi)2i明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.
(2) r具有以下性质:
(1)当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;
(2)当|r|≤1,并且|r|越接近1时,两个变量的线性相关程度越强;当|r|越接近0时,两个变量的线性相关程度越弱;
(3)相关性检验的步骤: ① 作统计假设
② 根据小概率0.05与n-2在附表中找出r的一个临界值r0.05 ③ 根据样本相关系数计算公式算出r值
④ 用统计判断,如果|r|?r0.05,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设. 如果|r|?r0.05,表明一个发生的概率不到5%的事件在一次试验中竟发生了.这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系.
6.独立性检验
(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.
(2)列出的两个分类变量的频数表,称为列联表.
2
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 2×2列联表
x1 x2 总计 y1 a c a+c y2 b d 总计 a+b c+d b+d a+b+c+d 2n?ad-bc?K2=(其中n=a+b+c+d为样本容量),可利用独立性
?a+b??a+c??c+d??b+d?
检验判断表来判断“x与y的关系”.
这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
当K2≥3.841时,则有95%的把握说事A与B有关; 当K2≥6.635时,则有99%的把握说事件A与B有关; 当K2≤2.706时,则认为事件A与B无关.
三.题型分析
题型1 相关关系的判断
题1.某棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):
施化肥量x 棉花产量y (1)画出散点图; (2)判断是否具有相关关系.
[审题视点] (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点. (2)根据散点图,分析两个变量是否存在相关关系. 解 (1)散点图如图所示
15 330 20 345 25 365 30 405 35 445 40 450 45 455 3
高中数学-变量间的相关关系与统计案例



