欢迎您选择新活力教育 用心学习 教案 学生:
第一章:统计案例
回归分析的基本思想及其初步应用
实例 从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:
编号 1 2 3 4 5 6 7 8 身高 165 165 157 170 175 165 155 170 体重 48 57 50 54 64 61 43 59 问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重. 解:由于问题中要求根据身高预报体重,因此 选 自变量x, 为因变量. (1)做散点图:
从散点图可以看出 和 有比较好的 相关关系.
(2) x= y=
?xyii?188i?
?xi?12i?
??所以b?xyii?188i?8xy?8x2?
?xi?12i??y?bx?? a于是得到回归直线的方程为
(3)身高为172cm的女大学生,由回归方程可以预报其体重为 ?y? 新知:用相关系数r可衡量两个变量之间 关系.计算公式为
r =
r>0, 相关, r<0 相关;
相关系数的绝对值越接近于1,两个变量的线性相关关系 ,它们的散点图越接近 ;
r? ,两个变量有 关系.
1
欢迎您选择新活力教育 用心学习 教案 学生:
例1某班5名学生的数学和物理成绩如下表: 学生 A B C D E 学科 数学成绩(x) 物理成绩(y) 88 78 76 65 75 70 64 62 62 60 (1) 画散点图;
(2) 求物理成绩y对数学成绩x的回归直线方程;
(3) 该班某学生数学成绩为96,试预测其物理成绩;
练习1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标准煤)的几组对照数据
x 3 4 5 6
y 2.5 3 4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y?bx?a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值3?2.5?4?3?5?4?6?4.5?66.5)
2
欢迎您选择新活力教育 用心学习 教案 学生:
当堂检测
1. 下列两个变量具有相关关系的是( ) A. 正方体的体积与边长 B. 人的身高与视力 C.人的身高与体重
D.匀速直线运动中的位移与时间
2. 在画两个变量的散点图时,下面哪个叙述是正确的( ) A. 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上
C. 可以选择两个变量中任意一个变量在x 轴上 D. 可选择两个变量中任意一个变量在 y 轴上
??a?必过( ) 3. 回归直线?y?bxA. (0,0) B. (x,0) C. (0,y) D. (x,y)
4.r越接近于1,两个变量的线性相关关系 .
5. 已知回归直线方程?y?0.5x?0.81,则x?25时,y的估计值为 .
6、一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果: 转速x (转/秒) 16 14 12 8 有缺点零件数 y (件) 11 9 8 5 (1)画散点图; (2)求回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制
在什么范围内?
相关指数:R2表示 对 的贡献,公式为:
R2?
R2的值越大,说明残差平方和 ,说明模型拟合效果 .
残差分析:通过 来判断拟合效果.通常借助 图实现.
残差图:横坐标表示 ,纵坐标表示 .
残差点比较均匀地落在 的区的区域中,说明选用的模型 , 带状区域的宽度越 ,说明拟合精度越 ,回归方程的预报精度越
3
欢迎您选择新活力教育 用心学习 教案 学生:
例1关于x与y有如下数据: x 2 30 4 40 5 60 6 50 8 70 y 为了对x、y两个变量进行统计分析,现有以下两种线性模型:?y?6.5x?17.5,
?y?7x?17,试比较哪一个模型拟合的效果更好?
例2 假定小麦基本苗数x与成熟期有效苗穗y之间存在相关关系,今测得5组数据如下: x 15.0 39.4 25.8 30.0 36.6 43.1 44.4 49.2 y 42.9 42.9 (1)画散点图; (2)求回归方程并对于基本苗数56.7预报期有效穗数; (3)求R2,并说明残差变量对有效穗数的影响占百分之几. (参考数据:?xi?5101.51,?xiyi?6746.76,
2i?1i?1nn?(yi?15i?y)?50.18,
2?(yi?15i??yi)2?9.117)
4
欢迎您选择新活力教育 用心学习 教案 学生:
练1. 某班5名学生的数学和物理成绩如下表: 学生 A B C D E 学科 数学成绩(x) 物理成绩(y) 88 78 76 65 75 70 64 62 62 60 ??y??(4)求学生A,B,C,D,E的物理成绩的实际成绩和回归直线方程预报成绩的差eyi.i2并作出残差图评价拟合效果.
练习:
1. 两个变量 y与x的回归模型中,分别选择了 4 个不同模型,它们的相关指数 R2如下 ,其中拟合
效果最好的模型是( ).
A. 模型 1 的相关指数R2为 0.98 B. 模型 2 的相关指数R2为 0.80 C. 模型 3 的相关指数R2为 0.50 D. 模型 4 的相关指数R2为 0.25
2. 在回归分析中,残差图中纵坐标为( ). A. 残差 B. 样本编号 C. x D. en
3. 通过e1,e2,?,en来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( ).
A.回归分析 B.独立性检验分析 C.残差分析 D. 散点图分析
4.R2越接近1,回归的效果 .
5. 在研究身高与体重的关系时,求得相关指数
R2? ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 .
5