回归分析的基本思想及其初步应用知识点整理
回归分析的基本思想及其初步应用知识点整理
要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.
重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和. 教学过程:
一、复习准备:
1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.
2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
二、讲授新课:
1. 教学总偏差平方和、残差平方和、回归平方和: (1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .
残差平方和:回归值与样本值差的平方和,即 .
回归平方和:相应回归值与样本均值差的平方和,即 . (2)学习要领:①注意 、 、 的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变
化程度之和,即 ;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数 来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好. 2. 教学例题:
例2 关于 与 有如下数据: 2 4 5 6 8 30 40 605070
为了对 、 两个变量进行统计分析,现有以下两种线性模型: , ,试比较哪一个模型拟合的效果更好. 用样本的频率分布估计总体的分布学案 j.Co M
学案4 用样本的频率分布估计总体的分布 【课标导航】
(1) 通过实例体会分布的意义和作用.
(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.
重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.
难点:能通过样本的频率分布估计总体的分布. 【知识导引】
在NBA的2020赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下?
甲运动员得分?12,15,20,25,31,31,36,36,37,39,44,49,50
乙运动员得分?8,13,14,16,23,26,28,38,39,51,31,29,33
请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?
如何根据这些数据作出正确的判断呢? 【自学导拨】 1.频率分布表
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映 的表格称为频率分布表. 2.绘制频率分布直方图的一般步骤为:
(1)计算 ,即一组数据中最大值与最小值的差; (2)决定 ;
○1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈现出来. ○2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组.
○3组距的选择.组距= ,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,如在左右两端各增加适当的范围(尽量使两端增加的量相同). (3)决定 ;
(4)列 ;一般为四列:分组、个数累计、频数、频率最后一行是合计,其中频数合计应是 ,频率合计是
(5)绘制频率分布直方图.为将频率分布直方图中的结果直观形象的表示出来,画图时,应以横轴表示分组,纵轴表示 ,其相应组距上的'频率等于该组上的长方形的面积,即每