首页 > 学生作文 > 读后感 > 读后感800字 >

中国人民大学汇总题库标准答案详解-抽样技术

由天下分享时间：2025/2/14 0:45:02 加入收藏我要投稿点赞

v(y)=

1???21?0.02857

s= ??200

* 640000 ≈ 3108.576

95%置信度下的区间估计为：

y±z0.025√??(??) = 1800±1.96*√3108.576 = 1800±109.28 因此区间估计为：[1690.72, 1909.28] （2）n0= z0.0252 * s2/(r2y2) =

1.962×6400000.12×18002

2388381.11232

32400

≈ 75.88

则需抽取76户家庭进行调查。有下列数据

层 1 2 3 设n=1000

Wh 0.35 0.55 0.1 yh 3.1 3.9 7.8 _

_sh 2 3.3 11.3 ph 0.54 0.39 0.24 （1）采用按比例分层抽样的方法估计Y和P并计算其标准误；

（2）采用奈曼分配的方法估计Y和P并计算标准误；

（3）将按比例分配和奈曼分配与简单随机抽样相比能提高效率多少。【解】

（1）根据题中已知条件，采用按比例分层抽样的方法估计Y为：

_?=y????prop=∑1??????=0.35*3.1+0.55*3.9+0.1*7.8=4.01

估计Y的方差和标准误差为： vprop(yst)=

1?????

S??2=

1?????

∑??1??????≈

(0.35*2+0.55*3.3+0.1*11.3)≈0.0201585 1000

222

sprop(yst)=√??(??????)=√0.0201585≈0.141981

估计P及其方差和标准误差为：

pprop=∑??1??????=0.35*0.54+0.55*0.39+0.1*0.24=0.4275

v(pprop)≈

1?????

∑??1?????????≈

11000

(0.35*0.54*0.46+0.55*0.39*0.61+0.1*0.24*0.76)≈

0.000218

s(pprop)=√??(??????????)=√0.000218≈0.014765

（2）采用Neyman分配的方法估计Y和P的方法和与（1）是一样的，即 ?_

??=yst=∑??1??????=0.35*3.1+0.55*3.9+0.1*7.8=4.01 pprop=∑??1??????=0.35*0.54+0.55*0.39+0.1*0.24=0.4275

但是采用Neyman分配估计Y和P的方差的方法不同，分别为：

2??2v(yst)=(∑??1??????) - ∑1??????≈

111

1000

(0.35*2+0.55*3.3+0.1*11.3)≈0.013286

s(yst)=√??(??????)=√0.013286≈0.115265 v(pst)≈

1??

(∑??=1???√??????)11000

(0.35*√0.54×0.46 + 0.55*√0.39×0.61 +

0.1*√0.24×0.76)≈0.000236

s(pst)=√??(??????????)=√0.000236=0.015362 （3）由于

Vsrs(y)=

1?????

≈

11000

2??2

(∑??)≈1??????+∑1???(??????)0.0201585+0.0017329=0.0218914

比例分配的设计效应为deffprop= v(yprop)/ Vsrs(y)=0.0218914≈0.9208,所以与简单随机抽样相比比例分配能提高效率1-deffprop=7.92%；

内曼分配的设计效应为deffopt= v(yst)/ Vsrs(y)=0.0218914≈0.6069，所以与简单随机抽样相比内曼分配能提高效率1-deffopt=39.31%.

0.0201585

0.013286

试题卷号： 4

名词解释

目标总体和抽样总体

目标总体也可简称为总体，是指所有研究对象的总体，或者是研究人员希望从中获取信息的总体，它是研究对象中所有性质相同的个体所组成。

抽样总体是指从中抽取样本的总体。通常情况下，抽样总体应该与目标总体完全一致，但实践中两者不一致的情况却时常发生。分层抽样

也叫类型抽样法，是将抽样单元按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本，将各层的样本结合起来，对总体的目标量进行估计。交叉子样本

在抽样时，对同一个总体按照同样的抽样方法，独立或非独立地来进行两个或两个以上样本的抽取，并使得每个子样本对总体参数都提供一个有用的估计，则被抽取的子样本称为交叉子样本。交叉子样本方法最早是由印度统计学家马哈拉诺比斯(P.C.Mahalanobis，1936年)所提出，最初用于总体参数的估计，以后扩大应用于抽样和非抽样误差的估计。逆抽样方法

针对样本中含有稀少项目很少或没有（设比例为P）的情况（调查产生比较大的偏差），事先根据调查精度和成本的要求，制定出样本中出现稀少项目的单元个数为n，然后一个一个地随机抽取样本，直到样本中具有这种属性的单元个数为n为止，然后对样本容量X的分布及P的估计的方法。

简述题

说明总体方差和估计量方差各自的作用，以及它们之间的相互关系。

总体方差是未知的，但是确定存在的。估计量方差可以由样本数据计算出来，但只是总体的近似反映，未必等于真实值。

试述随机化回答技术作用、特点，谈谈你对随机化回答技术的理解。

在调查中当一个问题是敏感性的或高度私人机密性的，则就会发生拒绝回答或回避回答的情况。为了获得对这类问题总体比例进行估计的资料，就需要采用随机化回答技术。

其基本特点是1）被调查者对所调查的问题采取随机回答的方式，调查人员无法从被调查者的回答中得知对方是否具有某种特征。这样，就可以在一定程度上消除被调查者的担心和顾虑，使他们参与调查，并提供真实情况。2）另一方面，调查人员通过对所有调查结果的汇总。利用概率原理进行推算，又可以得到总体中具有该特征人数比例的估计值，从而实现调查的目的。因而，随机化回答技术被认为是对敏感性问题进行调查，并对总体的特征比例进行数量推算的有效方法。

个人对随机化回答技术有如下理解：1）从理论上讲，随机化回答技术既可以用于访问调查，也可以用于邮寄问卷等其他方式的调查。但是，随机化回答问卷的设计比其他一般性调查问卷的设计要复杂。例如，在邮寄问卷调查中，被调查者很可能因为看不懂问卷而不知如何回答，在访问调查中，调查人员可以详细地向被调查者说明随机化回答技术的原理，并讲解如何回答这种类型的问卷，必要时还可以进行示范，帮助被调查者理解和掌握。所以，与其他调查方法相比，访问调查在使用随机化回答技术方面有更多的便利条件。2) 传统的随机化回答技术（如Warner）都是针对单变量数据的，其主要目的是为了获得具有敏感特性回答的概率估计。然而，被调查者的辅助信息却在一些情况下格外有用，以至于可以将其与肯定回答相联系。Maddala( 1983)以及Scheers和Dayton (1988)便将这些带有辅助信息的解释变量纳入随机化回答模型中。其优点在于可以减少标准误差，并可以确立协变量信息与敏感特性的总体概率之间关系。传统的随机化回答模型的另一个主要缺点是只能获得与总体水平有关的结论——总体概率的估计和相关置信区间。这与当时仅对单变量数据进行相关与无关随机化回答方法的发展目的一致，但却不能满足于调查者对单位水平参数的研究，这也导致无法对一些产生敏感特性的原因进行剖析。

此外在具体设计与操作上应该注意：1）要使被调查者充分理解这种方法的特点，特别是一定要让被调查者明白，他究竟回答的是哪一个问题，别人是不知道的，因此在正式抽取并回答问题前，要让被调查者作几次试验；2）所提问题必须简单明了，防止有不同的理解。3）在应用西蒙斯模型时，无关问题的选择特别重要。一定要隐蔽性强的，即调查人无从猜测被调查人对该问题回答的答案。

计算题

有下列数据

层 1 2 3 Nh 60 30 10 Sh 2 4 15 Yh 3 5 12 _现令n=40，要求

（1）样本在各层中进行的按比例分配；（2）样本在各层中进行的最优分配；（3）计算最优分配较按比例分配的得益；（4）计算按比例分配较简单随机抽样的得益。【解】由已知得：L=3,n=40,N=∑??1???=100, f=n/N=40/100=0.4

（1）由nh=nNh/N=Nhf 得n1=0.4*60=24, n2=0.4*30=12, n3=0.4*10=4, Vprop(yst)=

1?????

S??2=

1?????

∑??1??????=

1?0.440

*(0.6*4+0.3*16+0.1*225)=0.4455

（2）由内曼分配nh= ∑????