9.1.2 分层随机抽样 9.1.3 获取数据的途径
学习目标 1.理解分层随机抽样的概念.2.掌握用分层随机抽样从总体中抽取样本.3.掌握两种抽样的区别与联系.4.了解获取数据的一些基本途径.
知识点一 分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为x,y,两层的总体平均数分别为X,Y,总体平均数为W,样本平均数为w. mn则w=x+y.
m+nm+nW=
MN
X+Y. M+NM+N
(3)在比例分配的分层随机抽样中,可以直接用样本平均数w估计总体平均数W.
思考 分层随机抽样的总体具有什么特点? 答案 个体之间差异较大. 知识点二 获取数据的途径
获取数据的基本途径有通过调查获取数据、通过试验获取数据、通过观察获取数
据、通过查询获得数据等.
1.简单随机抽样和分层随机抽样都是等可能抽样.( √ )
2.分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.( √ ) 3.在分层随机抽样时,每层可以不等可能抽样.( × ) 4.通过网络查询的数据是真实的数据.( × )
一、对分层随机抽样的理解
例1 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( ) A.抽签法 C.分层随机抽样 答案 C
解析 由于老年人、中年人和青年人的身体情况会有明显的差异,所以要用分层随机抽样.故选C.
反思感悟 使用分层随机抽样的前提
分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
跟踪训练1 分层随机抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行( )
A.每层等可能抽样 B.每层可以不等可能抽样 C.所有层按同一抽样比等可能抽样 D.所有层抽取个体数量相同 答案 C
解析 保证每个个体等可能的被抽取是两种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽样.
B.随机数法 D.其他抽样方法
二、分层随机抽样的应用
例2 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.(1)试写出抽样过程;(2)若样本中3个区的高中学生的平均视力分别为4.8,4.8,4.6,试估计该市高中学生的平均视力.
解 (1)①由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样法抽取样本.
②确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是2∶3∶5,所以抽取的学生人数分别是
23
200×=40;200×=60;
2+3+52+3+5200×
5
=100.
2+3+5
③在各层分别按简单随机抽样法抽取样本. ④综合每层抽样,组成容量为200的样本.
4060100
(2)样本中高中学生的平均视力为200×4.8+200×4.8+200×4.6=4.7. 所以估计该市高中学生的平均视力约为4.7.
反思感悟 在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
1001(2)确定每层抽取个体的个数.抽样比为500=5, 1
则在不到35岁的职工中抽取125×5=25(人);
1
在35岁至49岁的职工中抽取280×5=56(人); 1
在50岁及50岁以上的职工中抽取95×5=19(人). (3)在各层分别按随机数法抽取样本. (4)汇总每层抽样,组成样本. 三 获取数据的途径
例3 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
解 一个城市交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
反思感悟 在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法和策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得到统计推断.
跟踪训练3 为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,该校应该怎样进行调查?
解 由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.
1.某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方法是( ) A.分层随机抽样 C.随机数法 答案 A
B.抽签法 D.其他随机抽样
解析 从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.
2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( ) A.9 B.10 C.12 D.13 答案 D
3n解析 ∵60=,∴n=13.
120+80+60
3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层随机抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A.6 B.8 C.10 D.12 答案 B
30
解析 设样本容量为N,则N×70=6, ∴N=14,∴高二年级所抽人数为14×
40
=8. 70
4.为了了解某市2019年高考各高中学校本科上线人数,收集数据进行统计,其中获取数据的途径采用什么样的方法比较合适( ) A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获取数据 答案 D
5.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为________分. 答案 108
2020
解析 样本中40名学生的平均分为40×110+40×106=108分,所以估计该组