贵州省贵阳市高考数学复习专题统计6(无答案)
1 基础知识 一、随机抽样
(一)简单随机抽样:
1、定义:一般的,设一个总体含有N个个体,从中地抽取n个个体作为样本(n?N),如果每次抽取时总体内的各个个体被抽到的,就把这种抽样方法叫做简单随机抽样. 说明:简单随机抽样必须具备下列特点:. 2.统计的有关概念:
总体: . 个体:. 样本:. 样本容量:. 总体容量:.
3.最常用的简单随机抽样方法有_____; ___ ___. 4. 抽签法步骤: (1); (2); (3); (4); 随机数表法步骤: (1); (2) ; (3);
5.抽签法的优点是,但是当总体的容量非常大时,费时费力不方便,可能导致抽样的不公平.
6.随机数表是由__________这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性________.
(二) 系统抽样
1定义:当总体中的个体数较多时,可将总体分成 的几个部分,然后预先制定的规则,从每一部分 ,得到所需要的样本,这样的抽样叫系统抽样.由于抽样的间隔相等,因此系统抽样也被称作 。在进行大规模的抽样调查时,系统抽样比简单抽样要方便。 2.系统抽样的步骤:
(1)采用随机的方式将总体中的个体.
(2)为将整个的编号进行分段,要确定分段的间隔k.当
NN是整数时,;当不是整数时,通过从总体nn中剔除些个体使剩下的总体中的个体N'能被n整除,这时
.
(3)在第一段用确定起始的个体编号l.
(4)按照事先确定的规则(将l加上间隔k)抽取样本:l,l?k,l?2k,.
(三)分层抽样
1定义: 当已知总体由_______的几部分组成时,为了使样本更能充分地反映总体的情况,常将总体中个体按某种特征分成若干个的几部分,每一部分叫做.在各层中按层在总体中所占_______进行抽样,这种抽样叫做_______. 2.分层抽样的步骤:
1
(1)将总体按一定的进行分层; (2)计算各层中与的比;
(3)按各层确定各层应抽取的个体数量; (4)在每层进行抽样,组成样本. 二、用样本估计总体:
(一)用样本的频率分布估计总体的分布 1、频率分布表
当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,我们把反映的表格称为频率分布表.
2、绘制频率分布直方图的一般步骤为:
(1)计算,即一组数据中最大值与最小值的差; (2)决定;
1组距与组数的确定没有确切的标准,将数据分组时组数应力求合适,以使数据的发布规律能较清楚地呈○现出来.
2组数与样本容量有关,一般样本容量越大,分的组数也越多,当样本容量为100时,常分8~12组. ○
3组距的选择.组距=,组距的选择力求取整,如果极差不利于分组(不能被组数整除)可适当增大极差,○
如在左右两端各增加适当的范围(尽量使两端增加的量相同). (3)决定;
(4)列;一般为四列:分组、个数累计、频数、频率最后一行是合计,其中频数合计应是,频率合计是 (5)绘制频率分布直方图.为将频率分布直方图中的结果直观形象的表示出来,画图时,应以横轴表示分组,纵轴表示,其相应组距上的频率等于该组上的长方形的面积,即每个小长方形的面积?组距?频率?,
组距且各小长方形的面积的总和等于.. 3.频率分布折线图
连接频率分布直方图中的中点,就得到频率分布折线图. 4.总体密度曲线
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的图会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比. (二) 用样本的数字特征估计总体的数字特征 一、众数、中位数、平均数 1.众数
一组数据中重复出现次数的数称为这组数的众数. 2.中位数
把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数. (1) 当数据个数为奇数时,中位数是按从小到大的顺序排列的的那个数.
(2) 当数据个数为偶数时,中位数是按从小到大的顺序排列的最中间两个数的. 3.平均数
如果有n个数x1,x2,x3,xn,那么叫这n个数的平均数.
4.实际问题中求得的众数、中位数、平均数应带上单位. 二、标准差、方差
1.数据的离散程度可用极差、、来描述.样本方差描述了一组数据围绕平均数波动的大小.一般地,设样
2
本的数据为x1,x2,x3,xn,样本的平均数为x,则定义
s2?,s2表示方差.
2.为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根 s?,s表示样本标准差.不要漏写单位.
三、频率分布直方图中估计众数、中位数、平均数 众数:最高矩形的中点.
中位数:左右两边直方图的面积相等.
平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 三、变量间的相关关系 1.相关关系的概念
在实际问题中,变量之间的常见关系有两类:
一类是,变量之间的关系可以用函数表示。例如正方形的面积S与其边长x之间的函数关系S?x; 一类是,变量之间有一定的联系,但不能完全用函数来表达。例如一块农田的水稻产量与施肥量的关系 相关关系:两个变量之间的关系叫做相关关系。 相关关系与函数关系的异同点: 相同点: 不同点:
2.求回归直线方程的思想方法
观察散点图的特征,发现各点大致分布在一条直线的附近。分析得到最能代表变量x与y之间关系的直线
2??a??bx?,其中a、b是的特征:即n个偏差的平方和最小,其过程简要分析如下:设所求的直线方程为yn?xiyi?nxy???b?i?1n1n2, x?xi。相应的直线叫回归直线,对两个变量所进行的上述统待定系数。??2x?nxn?i?1i?i?1?a?y?bx?计叫做回归分析。相关系数:r??xyii?1ni?nxyn(?xi?1n
2i22i?1?nx)(?y?ny)2i?12 典型例题 1、简单随机抽样
1.关于简单随机抽样的特点,有以下几种说法,其中不正确的是 A.要求总体的个数有限 B.从总体中逐个抽取
C.它是一种不放回抽样 D.每个个体被抽到的机会不一样,与先后顺序有关. 2.为了分析该校1000名学生的期末成绩,从中抽取100名学生的成绩单,则100名学生的成绩单是A.总体 B.个体 C.总体的一个样本 D.样本容量 4.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为A.150 B.200 C.100 D.120
5.为了解学校240名学生的身高情况,从中抽取40名学生进行测量,则样本容量是_____.
8.某学校为了调查学生的学习情况,由每班随机抽取5名学生进行调查,若(1)班有50名学生,将每
3
一学生编号从01到50止.请从随机数表的第2行第6列(下表为随机数表的前5行)开始,依次向右,直到取足样本,则抽取样本的号码是.
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95 97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73 16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10 12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76 55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30 2、系统抽样
1、为了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( )
A、40 B、30 C、20 D、12
2、为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目( ) A、2 B、4 C、5 D、6 3、用系统抽样的方法从个体数为1003的总体中抽取一个容量为50的样本,在整个抽样过程中每个个体被抽到的可能性为( )
A、1/1000 B、1/1003 C、50/1003 D、50/1000
4、为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本。 解:(1)随机地将这1003名学生编号为0001、0002、0003、…1003; (2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1000能被样本容量50整除,然后再按系统抽样的方法进行。
(3)先从总体中剔除3个个体后,对剩下的1000个体重新编,如可编为0001、0002~1000;
1000?50,所以1~20为第一段; 20(5)在第一段1~20内用简单随机抽样法抽得一个号码l;
(6)编号将l,50+l,…,50+l共20个号码选出;将这样选出的具有这20个编号的学生组成一个样本。
(4)将学生的编号进行分段,分成
3、分层抽样
1.某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,20
2.某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为
(A)9 (B)18 (C)27 (D) 36
3.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A.30 B.25 C.20 D.15
4.上海大众汽车厂生产了A、B、C三种不同型号的小轿车,产量分别1 200辆、6 000辆、2 000辆,为检验这三种型号的轿车质量,现在从中抽取46辆进行检验,那么应采用___________抽样方法,其中B型号车应抽查___________辆.
5.某大型超市销售的乳类商品有四种,纯奶、酸奶、婴幼儿奶粉、成人奶粉,且纯奶、酸奶、婴幼儿奶粉、成人奶粉分别有30种、10种、35种、25种不同的品牌,现采用分层抽样的方法从中抽取一个容量为n的样本进行三聚氰胺检测,若抽取的婴幼儿奶粉的品牌数是14,则n= .
4
4、用样本的频率分布估计总体的分布
1.将一个容量为n的样本分成若干组,已知某组的频数和频率分别为40和0.125,则n的值为 ( ) (A)640 (B)320 (C)240 (D)160
2.一个容量为32的样本,已知某组样本的频率为0.0625,则该组样本的频数为( ) A 2 B.4 C.6 D.8 3.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图,如图,据图可得这100名学生中体重在[56.5,64.5) kg的学生人数是( )
(A)20 (B)30 (C)40 (D)50
4.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n等于.
5.从某自动包装机包袋的食盐中,随机抽取20袋作为样本,按各袋的质量(单位:g)分成四组,
[490,495),?495,500?,?500,505?,[505,510],相应的样本频率分布直方图如图所示。
(I)估计样本中的位数是多少? (II)落入?500,505?的频数是多少? 解:(I)由已知可得直线x?的中位数是502.5。
(II)解法一:样本落入?490,495?的频数是:(0.01?5)?20=1
500?505?502.5,把频率分布直方图分为左右两侧等面积,故估计样本2?495,500?的频数是:(0.02?5)?20=2 ?505,510?的频数是:(0.03?5)?20=3
故落入?500,505?的频数是:20-(1+2+3)=14
解法二:样本落入?490,495?的频数是:0.01?5=0.05
?495,500?的频数是:0.02?5=0.10 ?505,510?的频数是:0.03?5=0.15
故样本落入?500,505?的频数是:1-(0.05+0.10+0.15)=0.7 所以样本落入?500,505?的频数是:0.7?20=14。 6.在某电脑杂志的一篇目文章中,每个句子的字数如下:
5
贵州省贵阳市高考数学复习专题统计6(无答案)



