存在一些偏差。
〖提问〗:那么如何从频率分布直方图中估计中位数呢? 分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数。因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等。由此可以估计出中位数的值为2.02。(图略见课本63页图2.2-6)
〖思考〗:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
课本63页图2.2-6)显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的。
〖思考〗:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例) <二>、标准差、方差
1.标准差
平均数为我们提供了样本数据的重要信息,可是,有时平均数
也会使我们作出对总体的片面判断。某地区的统计显示,该地区的中学生的平均身高为176㎝,给我们的印象是该地区的中学生生长发育好,身高较高。但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质。因此,只有平均数难以概括样本数据的实际状态。
例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕
甲运动员﹕7,8,6,8,6,5,8,10,7,4; 乙运动员﹕9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道,错误!未找到引用源。。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察P66图2.2-8)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
考察样本数据的分散程度的大小,最常用的统计量是标准差。标准差是样本数据到平均数的一种平均距离,一般用s表示。
样本数据错误!未找到引用源。的标准差的算法: (1)、算出样本数据的平均数错误!未找到引用源。。
(2)、算出每个样本数据与样本数据平均数的差:错误!未找到引用源。
(3)、算出(2)中错误!未找到引用源。的平方。 (4)、算出(3)中n个平方数的平均数,即为样本方差。 (5)、算出(4)中平均数的算术平方根,,即为样本标准差。 其计算公式为:
s?1[(x1?x)2?(x2?x)2?L?(xn?x)2]n显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:错误!未找到引用源。。当错误!未找到引用源。时,意味着所有的样本数据都等于样本平均数。
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机来计算标准差的方法。) 2.方差
从数学的角度考虑,人们有时用标准差的平方错误!未找到引用源。(即方差)来代替标准差,作为测量样本数据分散程度的工具:
s2?1[(x?x)2?(x?x)2?L?(x?x)2]12nn
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。 【例题精析】
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点。
(1)5,5,5,5,5,5,5,5,5 (2)4,4,4,5,5,5,6,6,6 (3)3,3,4,4,5,6,6,7,7 (4)2,2,2,2,5,8,8,8,8
分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差。 解:(图略,可查阅课本P68)
四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83。
他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的。
〖例2〗:(见课本P77)
分析: 比较两个人的生产质量,只要比较他们所生产的零件内径
尺寸所组成的两个总体的平均数与标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值。 【课堂精练】
P79 练习 1. 2. 3 【课堂小结】
1. 用样本的数字特征估计总体的数字特征分两类: a) 用样本平均数估计总体平均数。
b) 用样本标准差估计总体标准差。样本容量越大,估计就越精确。
2. 平均数对数据有“取齐”的作用,代表一组数据的平均水
平。
3. 标准差描述一组数据围绕平均数波动的大小,反映了一组
数据变化的幅度。