第一课时 1.1回归分析的基本思想及其初步应用(一)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指数和残差分析.
教学难点:解释残差变量的含义,了解偏差平方和分解的思想. 教学过程:
一、复习准备: 1. 提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关?
2. 复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据?作散点图?求回归直线方程?利用方程进行预报. 二、讲授新课: 1. 教学例题:
① 例1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 2 3 4 5 6 7 8 编 号 1 165 157 170 175 165 155 170 身高/cm 165 57 50 54 64 61 43 59 体重/kg 48 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. (分析思路?教师演示?学生整理)
7060 50 4030 20 100 150155160165170175180身高/cm
第一步:作散点图 第二步:求回归方程 第三步:代值计算 ② 提问:身高为172cm的女大学生的体重一定是60.316kg吗? 不一定,但一般可以认为她的体重在60.316kg左右. ③ 解释线性回归模型与一次函数的不同
事实上,观察上述散点图,我们可以发现女大学生的体重y和身高x之间的关系并不能用一次函数y?bx?a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型y?bx?a?e,其中残差变量e中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
2. 相关系数:相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义. 3. 小结:求线性回归方程的步骤、线性回归模型与一次函数的不同. 第二课时 1.1回归分析的基本思想及其初步应用(二)
体重/kg教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:
一、复习准备:
1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
二、讲授新课:
1. 教学总偏差平方和、残差平方和、回归平方和:
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即SST??(yi?y)2.
i?1n残差平方和:回归值与样本值差的平方和,即SSE??(yi?yi)2.
i?1n回归平方和:相应回归值与样本均值差的平方和,即SSR??(yi?y)2.
i?1n(2)学习要领:①注意yi、yi、y的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即?(yi?y)??(yi?yi)??(yi?y)2;③当总
22i?1i?1i?1nnn偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数R2?1??(yi?1ni?1ni?yi)2来刻画回归的效果,它表
?(yi?y)2示解释变量对预报变量变化的贡献率. R2的值越大,说明残差平方和越小,也就是说模型拟合的效果越好. 2. 教学例题:
例2 关于x与Y有如下数据: 2 4 5 6 8 x y 30 40 60 50 70 y?6.5x?17.5,y?7x?17,为了对x、现有以下两种线性模型:Y两个变量进行统计分析,试比较哪一个模型拟合的效果更好.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论.
(答案:R12?1??(yi?15i?15i?yi)2?1??y)2?(y1552?0.845,R2?1?1000?(yi?15i?15i?yi)2?1??y)2i?(y180?0.82,84.5%>82%,所以甲选1000i用的模型拟合效果较好.)
3. 小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
第三课时 1.1回归分析的基本思想及其初步应用(三)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法.
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学过程:
一、复习准备:
1. 给出例3:一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程.
21 温度x/C 产卵数y/个 7 23 11 25 21 27 24 29 66 32 115 35 325 (学生描述步骤,教师演示) 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某350300250个带状区域内,即两个变量不呈线性相关关系,所以不能直接200150用线性回归方程来建立两个变量之间的关系. 10050二、讲授新课: 00102030401. 探究非线性回归方程的确定: 温度① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模.
② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=C1eC2x的周围(其中,故可用指数函数模型来拟合这两个变量. c1,c2是待定的参数)
③ 在上式两边取对数,得lny?c2x?lnc1,再令z?lny,则z?c2x?lnc1,而z与x间的关系如下: X 21 23 25 27 29 32 35 76z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 54观察z与x的散点图,可以发现变换后样本点分布在一条直3线的附近,因此可以用线性回归方程来拟合. 21④ 利用计算器算得a??3.843,b?0.272,z与x间的线性0z产卵数回归方程为z?0.272x?3.843,因此红铃虫的产卵数对温度的非线性回归方程为y?e0.272x?3.843.
01020x3040⑤ 利用回归方程探究非线性回归问题,可按“作散点图?建模?确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 2. 小结:用回归方程探究非线性回归问题的方法、步骤. 三、巩固练习:
为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下: 1 2 3 4 5 6 天数x/天 繁殖个数y/个 6 12 25 49 95 190 (1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图; ?=e0.69x?1.112.) (2)试求出预报变量对解释变量的回归方程.(答案:所求非线性回归方程为y
第四课时 1.1回归分析的基本思想及其初步应用(四)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解