3.1 回归分析的基本思想及其初步
【课题】:3.1.1 回归分析的基本思想及其初步 【学情分析】:
教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。
【教学目标】:
(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解
判断两变量间的线性相关关系的强度——相关系数。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线
方程。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,
培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
【教学重点】:
1. 了解线性回归模型与函数模型的差异;
2. 了解两变量间的线性相关关系的强度——相关系数。
【教学难点】:
1. 了解两变量间的线性相关关系的强度——相关系数; 2. 了解线性回归模型与一次函数模型的差异。
【课前准备】:课件 【教学过程设计】: 教学环节 一、创设情境 教学活动 设计意图 问题一:一般情况下,体重与身高有一定的关系,通常个子较高的人体重复习回归分析比较大,但这是否一定正确?(是否存在普遍性) 用于解决什么样的师:提出问题,引导学生判断体重与身高之间的关系(函数关系、相问题。 关关系) 生:思考、讨论。 问题二:统计方法解决问题的基本过程是什么? 复习回归分析师:提出问题,引导学生回忆用最小二乘法求回归直线方程的方法。 的解题步骤 生:回忆、叙述 回归分析的基本过程:⑴画出两个变量的散点图; ⑵判断是否线性相关 ⑶求回归直线方程(利用最小二乘法) ⑷并用回归直线方程进行预报 探究活动:对于一组具有线性相关的数据(x1,y1),(x2,y2)……,(xn,yn),我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:a=y+bx, ^?二、例题选讲 ^?复习统计方法解决问题的基本过程。 学生动手画散 b=i?1n 点图,老师用EXCEL?(xi?x)2的作图工作演示,i?1并引导学生找出两个变量之间的关????1n1nxi,y=yi.(x,y)称为样本点的中心。你能推导出系。 其中x=ni?1ni?1 这两个计算公式吗? ^^从已经学过的知识我们知道,截距a和斜率b分别是使 n2(yi??xi??)取最小值时α,β的值。 Q(α,β)=学生经历数据i?1处理的过程,并借 由于 助EXCEL的统计功能鼓励学生使用计n????2 Q(α,β)=[yi??xi?(y??x)?(y??x)??] 算器或计算机等现i?1代工具来处理数 据。 ????2n{y?2[yi??xi?(y??x)] i??xi?(y??x)]= ???? i?1(y??x)??]?[(y??x)??]2} nn??????2=[yi??xi?(y??x)]+2[yi??xi?(y??x)](y??x??)+ i?1i?1 ??2n(y-βx-α), 注意到 n???? [yi??xi?(y??x)](y??x??) i?1 ^i?(xn?x)(yi?y)?? ?????????? =(y??x??)[yi?1n??ni??xi?(y??x)] n???? =(y??x??)[?????yi?1i???xi?n(y??x)] i?1 =(y??x??)[ny?n?x?n(y??x)]=0, 所以 Q(α,β)=[yi?1?????ni??xi?(y??x)]+ n(y??x??)2 ?n??n???2?? =β2?(xi?1ni?x)- 2β?(xi?x)(yi?y) + ?(yi?y)2 2i?1i?1+n (y??x?) ??2 =n(y??x??) + ??2?(xi?1ni2?x)[????(xi?1nni?x)(yi?y)???]2 2(x?x)?ii?1[ -?(xi?x)(yi?y)]i?1n??2?(xi?1ni?x)2? + ?(yi?1ni?y)2 ? 在上式中,后两项和α,β无关,而前两项为非负数,因此要Q取得最小值,当且仅当前两项的值均为0,即有 ?(x β=i?1nni?x)(yi?y)i???(xi?1?x)2?, α=y??x. 这正是我们所要推导的公式。 下面我们通过案例,进一步学习学习回归分析的基本思想及其应用。 问题三:思考例1:从某大学中随机选取8名女大学生,其身高和体重数据如表所示。求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。 编号 身高/cm 体重/kg 1 165 48 2 165 57 3 157 50 4 170 54 5 175 64 6 165 61 7 155 43 8 170 59 ?? 题目中表达了哪些信息? 师:读例1的要求,引导学生理解例题含义。 (例题含义:①数据体重与身高之间是一种不确定性的关系 ②求出以身高为自变量x,体重为因变量y的回归方程。 ③由方程求出当x = 172时,y的值。 生:思考、讨论、叙述自己的理解,归纳出题目中的信息。 根据以前所学的知识,让学生自己动手求出回归方程 求解过程如下: ①画出散点图,判断身高x与体重y之间存在什么关系(线性关系)? 706560 55 50 45 40155160165170175180 150②列表求出相关的量,并求出线性回归方程 ??代入公式有b?xyii?1nni?nxy??nx2?xi?12i72315?8?165.25?54.5?0.848 218774?8?165.252??y?bx?54.5?0.849?165.25??85.712 a?x?0.849x?85.712 ??a??b所以回归方程为y③利用回归方程预报身高172cm的女大学生的体重约为多少? ??0.849?172?85.712?60.316?kg? 当x?172时,y引导学生复习总结求线性回归方程的步骤: 第一步:作散点图—→第二步:求回归方程—→第三步:代值计算 三、探究新知 问题四:身高为172cm的女大学生的体重一定是60.316kg吗? (不一定,但一般可以认为她的体重在60.316kg左右.) 师:提出问题,引导学生比较函数模型与线性回归模型的不同,并引出相关系数的作用。 生:思考、讨论、解释 解释线性回归模型与一次函数的不同 从散点图可观察出,女大学生的体重y和身高x之间的关系并不能用一次函数y?bx?a来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型引导学生了解线性回归模型与一次函数的不同 其中残差变量e中包含体重不能由身高的线性函数解释的y?bx?a?e,所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式. 问题五:如何衡量两个变量之间线性相关关系的强弱呢? 相关系数:r???xi?1ni?x??yi?y?2??xi?1ni?x???yi?1n i?y?2相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当r大于0.75时,认为两个变量有很强的线性相关关系。 问题六:例1中由体重与身高建立的线性相关关系有无意义? 生:动手计算本例中两个变量之间的相关系数,r?0.798,表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的。 四、巩固练习 1. 假设关于某设备的使用年限x和支出的维修费用y(万元),有如下表的统计资料。试求: 使用年限x 维修费用y ⑴画出数据的散点图; ⑵若x与y呈线性相关关系,求线性回归方程 y = bx + a 的回归系数a、b; ⑶估计使用年限为10年时,维修费用是多少? 答案:⑴散点图如图: ⑵由已知条件制成下表: yi 引导学生在解决具体问题的过程中,通常先进行相关性的检验,确认两变量间的线性相关关系的强弱再求线性回归方程。 结合实例的分析和研究,正确地进行相关性检验。 巩固知识 2 3 4 5 6 2.2 3.8 5.5 6.5 7.0 876543210024xi68i xi xi xiyi 1 2 2.2 4.4 4 n2 3 3.8 11.4 9 n3 4 5.5 22.0 16 4 5 6.5 32.5 25 5 6 7.0 42.0 36 xi 2x?4; y?5; ?xi?12i?90;?xiyi?112.3 i?1