多阶段抽样
一、 单选题
1. 两阶(段)抽样中,对于一个估计量{ EMBED Equation.3 |??的均值可以表示为(A )。 A.
B. C. D.
2. 在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用(B)。 A.系统抽样 B.简单随机抽样 C.不等概率抽样 D.非概率抽样
3.初级单元大小不等的多阶段抽样中,无偏估计量成为自加权的条件是(C)。 A.第一阶段每个单元被抽中的概率相等 B.第二阶段每个单元被抽中的概率相等 C.最终阶段每个单元被抽中的概率相等 D.最终阶段每个单元被抽中的概率不等 4.在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为(C)。 A.二阶段抽样的方差<整群抽样的方差<分层抽样的方差 B. 二阶段抽样的方差>整群抽样的方差>分层抽样的方差 C. 分层抽样的方差<二阶段抽样的方差<整群抽样的方差 D. 分层抽样的方差>二阶段抽样的方差>整群抽样的方差 二、多选题
1.二阶段抽样中,初级单元大小不等时,一般可采用下面方法(AC)。
A.通过分层,将大小近似的初级单元分到一层,然后采用分层二阶段抽样 B.可按初级单元大小相等的方法处理
C.考虑用不等概率的抽样方法抽取初级单元
D.采用简单随机抽样抽取初级单元但改变估计量的形式 E.近似看成初级单元大小相等
2.确定样本量时需要考虑的因素有(AB)。 A.调查的费用 B.调查要求的精度 C.调查的时间 D.调查的技术 E.调查的目的
3.初级单元大小不等时,下面关于二阶段抽样总体总和的估计的说法正确的有(ABCD)。 A.可以采用放回的抽样方式,按不等概率抽取初级单元,此时可得总体总和 的估计量 B.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时有
C. 采用不放回抽样方式,按简单随机抽样抽取初级单元,此时
D. 采用不放回抽样方式,按不等概率抽样,此时有
E.可以采用放回的抽样方式,按简单随机抽样抽取初级单元,此时有
4.多阶段抽样相对于简单随机抽样的优点有(ACDE)。 A.实施方便
B.每个基本单元的调查费用比较低 C.能够充分发挥抽样的效率 D.节省人力、物力 E.可以分级准备抽样框
5.二阶段抽样中,关于总体比例的表达可以为(AE) A. B. C. D. E.
三、计算题
1. 对某商店上月销售额根据发票进行抽样估计,若该商店上月共用了18本发票,现用随机方法抽取了4本发票,每本发票有200张,从抽中的发票本中,每本分别随机抽取了40张发票,经过整理取得数据如下:
发票调查情况
第本样本发票 1 2 3 4 每本发票中40张发票金额 441.95 368.92 317.24 357.4 7180 4026.59 3260.77 4665.84 要求估计该商品上月销售额及估计的标准差。 2. 欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。调查的结果如下表:
对5家企业的调查结果
样本企业 1 2 3 4 5 第一日 57 38 51 48 62 第二日 59 41 60 53 55 第三日 64 50 63 49 54 要求根据这些数据推算100家企业改指标的总量,并给出估计的95%置信区间。
3. 某部委对所属企事业单位就一项改革方案进行抽样调查,采用二阶抽样。先在全部个单位(平均每个单位职工人数=250)中按简单随机抽样抽取n=350个单位,然后对抽中的每个单位再按简单随机抽样抽取m=8个职工进行调查。样本单位中赞成此项改革方案人数为k的单位频数(k=0,1,…,8),及赞成比例列在下表中,试估计该部委全体职工赞成该项方案的比例p,给出估计两的方差估计。
某部委350个单位对一项改革方案的调查结果
k 0 3 0 1 4 2 15 3 34 0.375 4 64 0.5 5 131 0.625 6 67 0.75 7 24 0.875 8 8 1 0.125 0.25 4. 欲调查某个新小区居民户家庭装潢聘请专业装潢公司的比例。我们在15个单元中随机抽取了5个的单元,每个单元有12户,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户的调查结果如下表:
被抽中的20户调查结果
样本单元 1 2 3 4 5 第一户 是 否 否 否 是 第二户 是 是 否 否 否 第三户 否 否 否 否 否 第四户 否 否 否 否 否 要求根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。
5. 某县农村共有14个乡509个村,在实现小康的进程中欲计算该县农村的恩格尔系数,即居民户的食品支出占总支出的比例。首先要调查全县的食品总支出,现采用了二阶抽样,第一阶段先在14个乡中,按村的数目多少进行pps抽样,共抽了5个乡,第二阶段在抽样中的乡中随机的抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:
被抽中样本食品支出状况
样本村序号 1 2 3 4 5 村数 19 41 72 54 36 样本村数 6 6 6 6 6 样本村平均食品支出 (万元) 48 175 108 90 100 要求估计全县的食品支出总金额及估计的标准误差。 6. 某服装联合企业,下面有90个缝纫厂,共有缝纫机4500台,据反映由于机器经常出现故障影响生产,管理部门拟用抽样方法调查上月每台机器因故障而停工的平均小时数,现采用二阶段抽样,第一阶段按简单随机抽样抽取10个工厂,第二阶段在抽中的工厂中抽20%的机器做样本,根据样本机器得如下数据:
样本机器调查结果 样本工厂 1 2 3 4 5 6 7 机器总数 50 65 45 48 52 58 42 样本数 10 13 9 10 10 12 8 5.4 4 5.67 4.8 4.3 3.83 5 11.38 1067 16.75 13.29 11.12 14.88 5.14 8 9 10 66 40 56 13 8 11 3.85 4.88 5 4.31 6.13 11.8 要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。
7. 某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表所示:
每座高层建筑拥有的楼层数 高层建筑 楼层 A 12 B 12 C 16 D 15 E 10 F 16 G 10 H 18 I 16 J 20 用二阶段抽样方法抽出10个楼层进行调查,第一阶段抽样为放回的、按于每座建筑拥有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。对10个楼层居民人数的调查结果如下,请对小区总居民数进行估计,并给出估计的精度。(95%的置信度)
被调查小区总居民数 一阶样本序号 居民数 1 18,12 2 15,18 3 19,13 4 16,10 5 16,11 8. 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,每间住6位同学。学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查的结果如下:
调查结果 样本宿舍 1 2 3 4 5 拍照人数 2 0 1 2 1 样本宿舍 6 7 8 9 10 拍照人数 1 0 1 1 0 试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
9. 上题中,学生会对女生勤工俭学月收入的一项调查中,根据以往同类问题的调查,宿舍的标准差为=326元,宿舍内同学之间的标准差为=188元。以一位同学进行调查来计算,调查每个宿舍的时间为10分钟,调查每一学生的时间为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间是为4小时,如果总的时间控制在8个小时内,则最优的样本宿舍和样本学生数为多少?
10. 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽取10块地,再从每块抽中的地块中抽10%的树苗,对抽中的苗木测量其高度取得资料如下: 地块(i) 秧苗数(Mi) 抽样数(mi) 苗木高度yij 1 2 3 4 5 6 7 8 9 10 52 56 60 46 49 51 50 61 60 45 5 6 6 5 5 5 5 6 6 6 12,11,12,10,13 10,9,7,9,8,10 6,5,7,5,6,4 7,8,7,7,6 10,11,13,12,12 14,15,13,12,13 6,7,6,8,7, 9,10,8,9,9,10 7,10,8,9,9,10 12,11,12,13,12,,12 已知共有M0=2600株苗木
(1)若两阶抽样都是简单随机的,调查结果用加权平均数来估计总体均值,求估计值,并计算;
(2) 抽样方法同(1),但估计量不加权,即用,求估计值并计算 (3) 抽样方法不变,使用比估计,即,求估计值及其标准误差 (4) 讨论上述三种方法的适用条件
11. 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一半饮食店进行检查,检查结果如下: 样本城市 1 2 3 4 饮食店总数 25 10 18 16 样本店数 13 5 9 8 检查卫生不合格数 4 1 4 2 要求估计这32个城市不合卫生要求的饮食店所占的比例及95%的置信区间。
12. 某城市共有六家医院,欲估计住院病人中长期住院病人所占的比例。现从这六家医院根据病床的多少采用放回按规模大小成比例的抽样方法抽取3个医院,再从抽中的医院中用简单随机抽样抽取10%的病人,调查长期住院病人(住院一个月以上)所占的比例.其数据如下:
样本医院 1 2 3 总住院病人数 430 280 190 抽选病人数 43 28 19 住院在一个月以上的病人数 5 4 3 要求估计住院在一个月以上病人占总住院病人的比例及其95%的置信区间.
13. 为估计一本英语字典的总字条效.先从26个字母中用放回的PPS抽样方法抽出10个字母,在抽中的字母中又不放回地抽取2页进行计数,其样本数据如下:
样本字母 总页数 样本页上数字 1 2