word文档可编辑,欢迎下载支持!
第十五单元 统计与统计案例
教材复习课
“统计与统计案例”相关基础知识一课过
三种抽样方法 [过双基] 三种抽样方法 类别 简单随机抽样 是不放回抽系统抽样 样,抽样过程中,每个个体被抽到的机分层抽样 共同点 各自特点 从总体中逐个抽取 将总体均分成几部分,按事先确定的规则,在各部分抽取 在起始部分抽样时,采用简单随机抽样 各层抽样时,采用简单随机抽样或系统抽样 相互联系 适用范围 总体中的个数较少 总体中的个数比较多 总体由差异明显的几部分组成 会(概率)相等 将总体分成几层,分层进行抽取 1.从一个容量为N的总体中抽取一个容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )
A.p1=p2 B.p2=p3 解析:选D 根据简单随机抽样、系统抽样和分层抽样的定义可知,无论哪种抽样,每个个体被抽中的概率都是相等的,所以p1=p2=p3. 2.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( ) A.10 C.12 B.11 D.16 解析:选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16. 3.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学中抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为( ) A.10 C.18 B.12 D.24 1 word文档可编辑,欢迎下载支持! 90 解析:选A 根据分层抽样的特征,从C学校中应抽取的人数为×60=10. 180+270+90 [清易错] N 1.系统抽样中,易忽视抽取的样本数也就是分段的段数,当n不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列. 样本容量n 2.分层抽样中,易忽视每层抽取的个体的比例是相同的,即. 总体个数N 1.从2 018名学生中选取50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从2 018名学生中剔除18名学生,剩下的2 000名学生再按系统抽样的方法抽取,则每名学生入选的概率( ) A.不全相等 C.都相等,且为 50 2 018 B.均不相等 1 D.都相等,且为 40 M 解析:选C 从N个个体中抽取M个个体,则每个个体被抽到的概率都等于. N2.从300名学生(其中男生180人,女生120人)中按性别用分层抽样的方法抽取50人参加比赛,则应该抽取男生人数为( ) A.27 C.33 B.30 D.36 解析:选B 因为男生与女生的比例为180∶120=3∶2, 所以应该抽取男生人数为50× 3 =30. 3+2 频率分布直方图和茎叶图 [过双基] 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 2 word文档可编辑,欢迎下载支持! 3.茎叶图的优点 茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便. 1.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于1 其他6个小长方形的面积的和的,且样本容量为80,则中间一组的频数为( ) 4 A.0.25 C.20 B.0.5 D.16 解析:选D 设中间一组的频数为x, xx1 1-?,解得x=16. 依题意有=?804?80? 2.某学生在8次测试中,数学成绩的茎叶图如图,则这8次成绩的中位数是( ) A.86 C.87.5 B.87 D.88.5 解析:选A 由茎叶图得到8个数的大小顺序依次是78,79,83,85,87,88,89,96,中间的两个数为85,87,所以中位数为 85+87 =86. 2 [清易错] 1.易把直方图与条形图混淆 两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的. 频率 2.易忽视频率分布直方图中纵轴表示的应为. 组距 3.在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义. 1.某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a的值为 ( ) A.0.006 C.0.004 5 解析:选B 由题意知,a= B.0.005 D.0.002 5 1-?0.02+0.03+0.04?×10 =0.005,故选B. 2×10 2.(2018·郑州检测)已知甲、乙两组数据如茎叶图所示,若它们的中m 位数相同,平均数也相同,则图中的m,n的比值n=________. 解析:由茎叶图可知甲的数据为27,30+m,39,乙的数据为20+n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m=3.由此可以得出甲的平均数为33,所以乙 3 word文档可编辑,欢迎下载支持! 20+n+32+34+38 的平均数也是33,所以=33, 4 m3 解得n=8,所以n=. 83 答案: 8 样本的数字特征 [过双基] 1.众数、中位数、平均数 数字特征 定义与求法 一组数据中重复出现次数最多的数 把一组数据按从小到大的中位数 顺序排列,处在中间位置的一个数据(或两个数据的平均数) 优点与缺点 众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使得无法客观地反映总体特征 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 众数 如果有n个数据x1,x2,…,平均数与每一个样本数据有关,可以反映平均数 xn,那么这n个数的平均数x1+x2+…+xnx= n2.标准差、方差 (1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s= 1222 [?x1-x?+?x2-x?+…+?xn-x?]. n (2)方差:标准差的平方s2 1 s2=n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,x是样本平均数. 1.对于一组数据xi(i=1,2,3,…,n),如果将它们改变为xi+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( ) A.平均数与方差均不变 C.平均数不变,方差变 B.平均数变,方差保持不变 D.平均数与方差均发生变化 出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 - 解析:选B 依题意,记原数据的平均数为x,方差为s2, ?x1+C?+?x2+C?+…+?xn+C?- 则新数据的平均数为=x+C,即新数据的平均数改变; n 4 word文档可编辑,欢迎下载支持! 1--- 新数据的方差为[(x1+C)-(x+C)]2+[(x2+C)-(x+C)]2+…+[(xn+C)-(x+C)]2=s2, n即新数据的方差不变. 2.样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为( ) A. 10 5 B.30 5 C.2 D.2 1 解析:选D 依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=(12+02+12+22 5+22)=2,即所求的样本方差为2. 3.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则a,b,c的大小关系为( ) A.a>b>c C.c>a>b B.b>c>a D.c>b>a 解析:选D 依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a<15,b=15,c=17,c>b>a. 4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表: 学生 甲班 乙班 1号 6 6 2号 7 7 3号 7 6 4号 8 7 5号 7 9 若以上两组数据的方差中较小的一个为s2,则s2=________. 解析:由数据表可得乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,12其方差较小,其平均值为7,方差s2=(1+0+0+1+0)=. 55 2 答案: 5 变量间的相关关系、统计案例 [过双基] 1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近, 5