第三章 统计案例
3.1 回归分析的基本思想及其初步 第2课时
学情分析:
教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。在教学中,要结合实例,让学生了解随机误差产生的原因。初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。在起点高的班级中通过让学生观察、思考与讨论,进一步体会回归分析中的数理计算,及运用相关指数与残差分析来刻画模型拟合效果,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 教学目标:
(1)知识与技能:了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随
机误差产生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。
(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的
回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。
(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和
求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
教学重点:
1. 了解判断刻画模型拟合效果的方法——相关指数和残差分析;
2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。 教学难点:
1. 了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度; 2. 了解判断刻画模型拟合效果的方法——相关指数和残差分析。 教学过程设计: 教学环节 教学活动 设计意图 一、创1.由例1知,体重的值受身高或随机误差的影响。 引入回归分析设情2.问题一:身高172cm的女大学生的体重一定是60.316kg吗?如的效果评价的境 果不是,其原因是什么? 三个统计量 二、探解答问题一: 究新 知 70656055504540150155160165170175180结合实例由结果分析残差图是否异常,养成从实际问题出发,抽象为数学问题中的线性回归问显然,身高172cm的女大学生的体重不一定是60.316kg,但一题,从而指导般可以认为她的体重接近于60.316kg.上图3.1-2中的样本点和回实际问题的解归直线的相互位置说明了这一点. 由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示: y=bx+a+e (3) 决。 ~ 这里a和b为模型的未知参数,e是y与y?bx?a之间的误差。通 常e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)= ?2?0.这样线性回归模型的完整表达式为: ?y?bx?a?e ? (4) 2?E(e)?0,D(e)?? 2在线性回归模型(4)中,随机误差e的方差?越小,通过回 归直线 ~ y?bx?a (5) ^预报真实值y的精度越高。随机误差是引起预报值y与真实值y之 间的误差的原因之一,大小取决于随机误差的方差。 ^^另一方面,由于公式(1)和(2)中a和b为截距和斜率的估计 ^ 值,它们与真实值a和b之间也存在误差,这种误差是引起预报值y 与真实值y之间误差的另一个原因。 思考1、产生随机误差项e的原因是什么? 学生思考,回答:实际上,从上例中,一个人的体重值除了受身高的影响外,答 还受到许多其它因素的影响。例如饮食习惯、是否喜欢运动、度量 误差等。另外,我们选用的线性模型往往只是一种近似的模型。所 有这些因素都会导致随机误差项e的产生。 ~问题二、在线性回归模型中,e是用y预报真实值y的误差,它是一 个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精 度? 解答问题二: 因为随机误差是随机变量,因此可以通过这个随机变量的数字特 征来刻画它的一些总体特征。均值是反映随机变量取值平均水平的 数字特征,方差是反映随机变量集中于均值程度的数字特征,而随 机误差的均值为0,因此可以用方差?2来衡量随机误差的大小。 为了衡量预报的精度,需要估计?2的值。一个自然的想法是通 过样本方差来估计总体方差。如何得到随机变量e的样本呢?由于 模型(3)或(4)中的e隐含在预报变量y中,我们无法精确地把它从y 中分离出来,因此也就无法得到随机变量e的样本。 解决问题的途径是通过样本的估计值来估计?2。根据截距和斜 率的估计公式(1)和(2),可以建立回归方程 ^^^ y?bx?a ^~~^^ 因此y是(5)中y的估计量。由于随机误差e?y?y,所以e?y?y 是e的估计量,对于样本点 (x1,y1),(x2,y2),…,(xn,yn) 而言,相当于它们的随机误差为 ~ ei?yi?yi?yi?bxi?a,i=1,2, …,n, 其估计值为 ^^^^ e?yi?yi?yi?bxi?a,i=1,2, …,n, ^ 。类比样本方差估计总体ei称为相应于点(xi,yi)的残差(residual) 方差的思想,可以用 2^2^^ 1n^1 ?? (n>2) e?Q(a,b)?in?2n?2i?1 ^^^^2作为?的估计量,其中a和b由公式(1)(2)给出,Q(a,b)称为残 ^ 2差平方和(residual sum of squares),可以用?衡量回归方程的 ^ 预报精度。通常,?2越小,预报精度越高。 学生动手计算出例1中的残差(如下表)与残差平方和。 1 2 3 4 5 6 7 8 身高 165cm 165cm 157cm 170cm 175cm 165cm 155cm 170cm 引导学生利用体重 48kg 57kg 50kg 54kg 64kg 61kg 43kg 59kg 残差也可以分yi ei 54.373 -6.373 54.373 47.5858.611 8 -4.618 62.8654.373 3 45.883 -2.883 58.618 0.382 2.627 2.419 1.137 6.627 析所求出的模型的拟合效果
人教版高中数学选修2-3-3.1-回归分析的基本思想及其初步应用-第2课时同步课堂教案
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)
![](/skin/haowen/images/icon_star.png)