3. 1.1回归分析的基本思想及其初步应用
【教学目标】1.了解回归分析的基本思想方法及其简单应用. 2.会解释解释变量和预报变量的关系. 【教学重难点】
教学重点:回归分析的应用.
$公式的推到. $、b教学难点:a【教学过程】
一、设置情境,引入课题
引入:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(x3,y3),L,(xn,yn).其回归直线方程的截距和斜率的最小二乘法估计公式分别为:
$?$?y?bx$ ba?(x?x)(y?y)iii?1n?(x?x)ii?1n
21n1nx??xi y??yi (x,y)称为样本点的中心。
ni?1ni?1如何推到着两个计算公式? 二、引导探究,推出公式
$和斜率b$分别是使Q(?,?)?(y??x??)2取最小值时从已经学过的知识,截距a?iii?1n?,?的值,由于
Q(?,?)??[yi??xi?(y??x)+(y??x)??]2i?1n??{[yi??xi?(y??x)]2?2[yi??xi?(y??x)]g[(y??x)??]?[(y??x)??]2}i?1n2??[yi??xi?(y??x)]?2?[yi??xi?(y??x)]g[(y??x)??]?n(y??x??)2i?1i?1nn因为
?(y??x??)?[y??x?(y??x)](y??x??)?[y??x?(y??x)]iiiii?1i?1nn?(y??x??)[?yi???xi?n(y??x)]?(y??x??)[ny?n?x?n(y??x)]?0,i?1i?1nn
所以
1
Q(?,?)??[yi??xi?(y??x)]2?n[(y??x)??]2i?1n??2?(x?x)ii?1n22?2??(xi?x)(yi?y)??(yi?y)2?n(y??x??)i?1i?1nn?n(y??x??)??(xi?x)[??22i?1n?(x?x)(y?y)iii?1n?(x?x)ii?1n]?2[?(xi?x)(yi?y)]2i?1n2?(x?x)ii?1n2??(yi?y)2i?1n在上式中,后两项和?,?无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0.,既有
???(x?x)(y?y)iii?1n?(x?x)ii?1n ??y??x
2通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出。
$?$?y?bx$ b所以:a?(x?x)(y?y)iii?1n?(x?x)ii?1n
2三、例题应用,剖析回归基本思想与方法
例1、 从某大学中随机选取8名女大学生,其身高和体重的数据如图所示: 编号 身高/cm 体重/kg 1 165 48 2 165 57 3 157 50 4 170 54 5 6 165 61 7 155 43 8 170 59 175 64 (1) 画出以身高为自变量x,体重为因变量y的散点图 (2) 求根据女大学生的身高预报体重的回归方程 (3) 求预报一名身高为172cm的女大学生的体重 解:(1)由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y作散点图
$?0.849,a$??85.712Qb(2)
$?回归方程:y?0.849x?85.712.(3)对于身高172cm的女大学生,由回归方程可以预报体重为:
$y?0.849?172?85.712?60.316(kg)
四、当堂练习
观察两相关变量得如下数据
2
x y —1 —9 —2 —7 —3 —5 —4 —3 —5 —1 5 1 3 5 4 3 2 7 1 9 求两个变量的回归方程. 答:Qx?0,y?0,10?xi?1102i?110,?xiyi?110,
i?110?b??xy?10xyiii?110?xi2?10xi?12?110?10?0?1,a?y?bx?0?0gb?0.
110?10?0所以所求回归直线方程为$y?x 五、课堂小结
$、b$公式的推到过程。 1. a$?a$2.$y?bx通过(x,y)
六、布置作业 课本90页习题1
3
3.1.1回归分析的基本思想及其初步应用
课前预习学案
一、预习目标
$与斜率b$分别是使Q(?,?)?(y??x??)2取最小值时,求?,?的值。 通过截距a?iii?1n二、预习内容:
1. 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(x3,y3),L,(xn,yn).其回归直线方
程的截距和斜率的最小二乘法估计公式:
$= ,b$= a2.x= , y= 3.样本点的中心
三、提出问题
如何使 Q(?,?)值最小,通过观察分析式子进行试探推到 课内探究学案 一、学习目标
1. 了解回归分析的基本思想和方法 2. 培养学生观察分析计算的能力 二、学习重难点
$?a$学习重点:回归方程$, y?bx$公式的推到 $、b学习难点:a三、学习过程
1.使Q(?,?)值最小时,?,?值的推到
2.结论 ???(x?x)(y?y)iii?1n?(x?x)ii?1n ??y??x
2$的含义是什么 $?a$$和b3.$中ay?bx4. (x,y)一定通过回归方程吗?
四、典型例题
例1.研究某灌溉倒水的流速y与水深x之间的关系,测得一组数据如下:
1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 水深x(m) 4
流速y(m/s) 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1) 求y与x的回归直线方程; (2) 预测水深为1.95m时水的流速是多少?
分析:(1)y与x的回归直线方程为$y?0.733x?0.6948 (2)当水深为1.95m时,可以预测水的流速约为2.12m/s 五、当堂练习
(x1,y1),(x2,y2),(x3,y3),L,(xn,yn).1.对两个变量y和x进行回归分析,得到一组样本数据:
则下列说法不正确的是( )
$?a$A.由样本数据得到的回归方程$必过样本中心(x,y) y?bxB.残差平方和越小的模型,拟合的效果越好
C.用相关指数R来刻画回归效果,R越小,说明模型的拟合效果越好
D.若变量y与x之间的相关系数r??0.9362,则变量y与x之间具有线性相关关系
2.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:
1985 1986 1987 1988 1989 1990 1991 1992 年份 x(kg) y(t) 年份 x(kg) y(t) 70 5.1 1993 92 11.5 74 6.0 80 6.8 1994 108 11.0 78 7.8 1995 115 11.8 85 9.0 1996 123 12.2 92 10.2 1997 130 12.5 90 10.0 1998 138 12.8 95 12.0 1999 145 13.0 22若x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积蔬菜的年平均产量.(已知x?101,y?10.11,解:设所求的回归直线方程为$y?bx?a,则
?xi?1152i?161,?xiyi?16076.8)
i?115?b??xy?15xyiii?11515?xi2?15xi?12?16076.8?15?101?10.11?0.0937,a?y?bx?10.11?0.0937?101?0.6463.2161125?15?101所以,回归直线方程为:$y?0.0937x?0.6463
5