第2讲 用样本估计总体
[考纲解读] 1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点.(重点) 2.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释. 3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点) 4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题. [考向预测] 从近三年高考情况来看,本讲是高考中的一个热点.预测2024年将会考查用样本估计总体,主要体现在利用频率分布直方图或茎叶图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图与茎叶图也可能出现于解答题中,与概率等知识综合命题.
1.用样本的频率分布估计总体分布
(1)频率分布:样本中所有数据(或者数据组)的频数和样本容量的比,就是该01频率,所有数据(或者数据组)的频率的分布变化规律叫做□02频率分布. 数据的□03最大值与□04最(2)作频率分布直方图的步骤:①求极差,即一组数据中的□05组距与组数;③将□06数据分组;④列□07频率分布表;⑤画频小值的差;②决定□率分布直方图.
08频率/组距,09在频率分布直方图中,纵轴表示□数据落在各小组内的频率用□101. 各小长方形的面积表示,各小长方形的面积总和等于□(3)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线.
1
(4)茎叶图:统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一列数,叶是从茎的旁边生长出来的数.
2.样本的数字特征 (1)众数、中位数、平均数
(2)方差和标准差
2
1---
方差:s2=n[(x1-x)2+(x2-x)2+…+(xn-x)2], 标准差: s=
1-2-2-2[?x1-x?+?x2-x?+…+?xn-x?]. n
(3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.各种统计表的优点与不足
3
1.概念辨析
(1)一组数据的方差越大,说明这组数据的波动越大.( )
(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(3)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
答案 (1)√ (2)√ (3)√ (4)×
2.小题热身
(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数 答案 B
解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.
(2)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92 答案 A
11
解析 由茎叶图可知,这组数据的中位数是2×(91+92)=91.5,平均数是8×(87+89+90+91+92+93+94+96)=91.5.
4
(3)如图所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是( )
A.50 B.40 C.30 D.14 答案 C
解析 因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30.故选C.
(4)已知一组数据87,89,90,91,93,则该组数据的方差是________. 答案 4
1
解析 该组数据的平均值为5×(87+89+90+91+93)=90,所以该组数据1
的方差为5×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4.
题型 一 样本数字特征的计算及应用
1.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为165,那么由此求出的平均数与实际平均数的差是( )
A.2.5 B.-2 C.2 D.-2.5 答案 C
解析 将105输入为165,多输入了60,60÷30=2,所以求出的平均数与实
5