第三节 统计图表、用样本估计总体
[考纲传真] (教师用书独具)1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.
(对应学生用书第162页)
[基础知识填充]
1.常用统计图表
(1)频率分布表的画法:
极差
第一步:求极差,决定组数和组距,组距=;
组数
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图.
频率
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
组距(3)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(4)茎叶图的画法:
第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将各个数据的茎按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的右(左)侧. 2.样本的数字特征
(1)众数、中位数、平均数 数字特征 众 数 定义与求法 一组数据中出现次数最多的数 优点与缺点 通常用于描述出现次数最多的数,显然它对其他数据信息的忽视使得无法客观地反映总体特征
中 位 数 把一组数据按大小顺序排列,处在最中间位置的一个数据(或两个数据的平均数) 中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 平 均 数 如果有n个数据x1,x2,…,平均数和每一个数据有关,可以反映样xn,那么这n个数的平均数本数据全体的信息,但平均数受数据中1x=(x1+x2+…+xn) 极端值的影响较大,使平均数在估计总体时可靠性降低 n(2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用s表示,s=1n[(x1-x)+(x2-x)+…+(xn-x)]. 2
222②方差:标准差的平方s
s2=[(x1-x)2+(x2-x)2+…+(xn-x)2],其中xi(i=1,2,3,…,n)是样本数据,
nn是样本容量,x是样本平均数.
[知识拓展] 平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mxn+
1
a的平均数是mx+a.
(2)数据x1,x2,…,xn的方差为s.
①数据x1+a,x2+a,…,xn+a的方差也为s; ②数据ax1,ax2,…,axn的方差为as.
[基本能力自测]
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中. ( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散.
22
2
2
频率
(3)正确.小矩形的面积=组距×=频率.
组距
(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.
[答案] (1)√ (2)× (3)√ (4)×
2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图9-3-1所示,则这组数据的中位数和平均数分别是( )
图9-3-1
A.91.5和91.5 C.91和91.5
B.91.5和92 D.92和92
A [这组数据由小到大排列为87,89,90,91,92,93,94,96. 91+92所以中位数是=91.5,
2
87+89+90+91+92+93+94+96
平均数x==91.5.]
8
3.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差 C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
B [因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.]
4.如图9-3-2所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20]内的频数是( )
图9-3-2
A.50 B.40 C.30 D.14
C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在
[15,20]的频数为0.3×100=30,故选C.]
5.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图9-3-3,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为
x,那么x的值为________.
图9-3-3
1
2 [170+×(1+2+x+4+5+10+11)=175,
71
则×(33+x)=5,即33+x=35,解得x=2.] 7
(对应学生用书第163页)
频率分布直方图 (2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图9-3-4所示频率分布直方图:
图9-3-4
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
[解] (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4,
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=
0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5, 5
所以总体中分数在区间[40,50)内的人数估计为400×=20.
100
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 1
所以样本中分数不小于70的男生人数为60×=30,
2所以样本中的男生人数为30×2=60, 女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2,
所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. [规律方法] 频率、频数、样本容量的计算方法 12频率×组距=频率. 组距频数频数=频率,=样本容量,样本容量×频率=频数. 样本容量频率易错警示:绘制频率分布直方图时的3个注意点 1制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确; 频率2频率分布直方图的纵坐标是,而不是频率. 组距3注意中值估算法. [跟踪训练] (1)(2017·河南新乡调研)统计新生婴儿的体重,其频率分布直方图如图9-3-5所示(每组含右端点,不含左端点),则新生婴儿体重在(2 700,3 000]克内的频率为( )
【导学号:79140329】
图9-3-5
A.0.001 C.0.2
B.0.1 D.0.3
(2)(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9-3-6所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据
高考数学一轮复习: 第9章 算法初步、统计与统计案例 第3节 统计图表、用样本估计总体



