《统计学原理》作业(三)
(第五~第七章)
一、判断题
1、抽样推断是利用样本资料对总体的数量特征进行的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(× )
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(× )
3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、抽样误差即代表性误差和登记误差,这两种误差都是不可避免的。(×)
5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 6、在一定条件下,施肥量与收获率是正相关关系。( √ )
7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高。( √ )
8、利用一个回归方程,两个变量可以互相推算(×) 二、单项选择题
1、在一定的抽样平均误差条件下( A )。 A、扩大极限误差范围,
2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。 C、抽样平均误差
3、抽样平均误差是( C )。 C、抽样指标的标准差
4、当成数等于( C)时,成数的方差最大。 c、0.5
5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。 C、在此76%与84%之间
6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( A )。 A、甲厂比乙厂大
7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B )。 B、抽样极限误差;
8、如果变量x 和变量y 之间的相关系数为 1 ,说明两变量之间( D )。 D、完全相关
9、一般说,当居民的收入减少时,居民的储蓄款也会相应减少,二者之间的关系是( A )。 A、直线相关
10、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为yc=30+60x ,意味着劳动生产率每提高2千元时,工人工资平均增加(B )。 B、120元
11、如果变量x 和变量y 之间的相关系数为-1,说明两个变量之间是( B) B、完全相关关系
12、价格不变的条件下,商品销售额和销售量之间存在着( D )。 D、完全的依存关系 三、多项选择题
1、影响抽样误差大小的因素有( A、B、C、D )。 A、抽样调查的组织形式 B、抽取样本单位的方法
C、总体被研究标志的变异程度 D、抽取样本单位数的多少 2、在抽样推断中(A、C、D )。
1 / 7
A、抽样指标的数值不是唯一的C、可能抽取许多个样本 D、统计量是样本变量的涵数 3、从全及总体中抽取样本单位的方法有(B、C )。 B、重复抽样 C、不重复抽样
4、在抽样推断中,样本单位数的多少取决于( A、B、C、E )。
A、总体标准差的大小B、允许误差的大小 C、抽样估计的把握程度 E、抽样方法 5、总体参数区间估计必须具备的三个要素是( B、D、E )。 B、样本指标 D、抽样误差范围 E、抽样估计的置信度 6、在抽样平均误差一定的条件下( A、D )。
A、扩大极限误差的范围,可以提高推断的可靠程度 D、缩小极限误差的范围,只能降低推断的可靠程度 7、判定现象之间有无相关关系的方法是(A、B、C、D )。
A、对客观现象作定性分析 B、编制相关表 C、绘制相关图 D、计算相关系数 8、相关分析特点有( B、 C、D、E )。
B.两变量只能算出一个相关系数C.相关系数有正负号 D.两变量都是随机的 E.相关系数的绝对值介于0和1之间 9、下列属于负相关的现象是( A、B、D )。
A、商品流转的规模愈大,流通费用水平越低 B、流通费用率随商品销售额的增加而减少 D、生产单位产品所耗工时随劳动生产率的提高而减少
10、设产品的单位成本(元)对产量(百件)的直线回归方程为 ,这表示(A、C、E) A、产量每增加100件,单位成本平均下降1.85元C、产量与单位成本按相反方向变动 E、当产量为200件时,单位成本为72.3元 四、简答题
1、例子说明总体、样本、参数、统计量、变量这几个概念?
答:如果研究的对象是100人,这100人就是总体。从中抽取10人做研究,那就是样本。参数是反映总体统计特征的数字,如这100人的平均身高,方差等等。变量就是反应总体的某些特性的量,如身高。 2、什么是抽样平均误差和抽样极限误差?二者有何关系?写出二者的计算机公式
答:抽样平均误差是反映抽样误差一般水平的指标;而抽样极限误差是反映抽样误差的最大范围的指标,二者既有联系又有区别。二者的联系是:极限误差是在抽样平均误差的基础上计算得到的,即 ; 二者的区别是:(1)二者涵义不同;
(2)影响误差大小的因素不同; (3)计算方法不同。
抽样平均误差=标准差/样本单位数的平方根;抽样极限误差=样本平均数减去总体平均数的绝对值;抽样极限误差是T倍的抽样平均误差。
3、解释相关关系的含义,说明相关关系的特点。
率确定时,年利息额y与存款额x之间就是函数关系,它表现为y=x×r。而相关关系就没有这样确定的关系了,我们把变量之间存在的不确定的数量关系称为相关关系(correlation)。比如家庭的储蓄额和家庭收入之间的关系。如果发现家庭储蓄额随家庭收入的增长而增长,但它们并不是按照一个固定不变的比率变化的,由于可能还会有其他很多较小的因素影响着家庭储蓄这个变量,因此这其中可能会有高低的偏差,这种关系就是相关关系而不是函数关系。
x取某一个值时,变量y的取值可能有
几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无任何规律可循。通过对大量数据的观察与研究,我们就会发现许多变量之间确实存在一定的客观规律。
4、请写出计算相关系数的简要公式,说明相关关系的取值范围及其判断标准?
2 / 7
答:相关系数的简要公式:
r?1?xy?n?x?y??112??2??22x???x????y???y????nn????
0?r?0时为负相关。 1)相关系数的数值范围是在 –1 和 +1 之间,即时 ,r?0时为正相关,??1
2)当 时, x与y完全相关;两变量 是函数关系; ??1微弱相关 ??0.3低度相关 0.3???o.5当时,x?与?y1不完全相关 0?o.5???0.8(存在一定线性相关)显著相关
高度相关 0.8???0.1当时,x0与y不相关 ??yc?a?bx5、拟合回归程yc=a+bx有什么前提条件? 在回归方程yc=a+bx,参数a,b 的经济含义是什么?
答:1)拟合回归方程 的要求有:1)两变量之间确存在线性相关关系;2)两变量相关的密切程度必须是显著
相关以上;3)找到全适的参数a,b使所确定的回归方程达到使实际的y值与对应的理论估计值yc的离差平方和为最小。
2)a的经济含义是代表直线的起点值,在数学上称为直线的纵轴截距,它表示x=0时y常项。
参数b 称为回归系数,表示自变量增加一个单位时因变量y的平均增加值,回归系数b 正负号可以判断相关方向,当b>0时,表示正相关,当b<0表示负相关。
五、计算题
1、某企业生产一批零件,随机重复抽取400只做使用寿命实验。测试结果平均寿命为5000小时,样本标准差为300小时,400只中发现10只不合格。根据以上资料计算平均数的抽样平均误差和成数的抽样平均误差。(学习指导书P177第2题)
解:1)平均数的抽样平均误差:
?300????15小时 xn400
2)成数的抽样平均误差: p(1?p)25%*75&%?x ???0.78%n400
2、外贸公司出口一种食品,规定每包规格不低于150克,现在用重复抽样的方法抽取其中的100包进行检验,其结果如下:
每包重量(克) 包 数 3 / 7
148-149 149-150 150-151 151-152 —— 10 20 50 20 100 要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求; (2)以同样的概率保证估计这批食品合格率范围。 解:
Xf 2 组中值 包数f 148.5 149.5 150.5 151.5 合计 100??f10 20 50 20 ?xf1485 1990 7525 3030 (x?x)f32.4 12.8 2 28.8 ??f 15030= ?xf76= ?xf?15030?150.30(x?x)2f76?x???(克) ??0.872 (克) 100f?100?f
?0.872????0.0872?x?t?x?3?0.0872?0.26x
n100 x??x?X?x??x
0.26?150.30?X?150.30?0.26
?(x?x)2f150.04?X?150.562)已知:n?100;n1?70;t?3
p?
p?3?4.58?13.74?p?t?n170? ?100%?70%;?p?n100P(1?P)0.7(1?0.7)??4.58%n100
p??p?P??p??p?13.74%?70%?P?70%?13.74%
56.26%?P?83.74%
答:1)以99.73%的概率估计这批食品平均每包重量的范围为150.04---150.56克,大于150克,所以平均重量是达到规格要求 2) 以99.73%的概率保证估计这批食品合格率范围为56.26%--83.74。
3、单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87
要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列。(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围。(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工? 解:1)分配数列 成绩 60以下 60——70 工人数(频数)f 3 6 各组企业数所占比重(频率)% 7.5 15 f?f4 / 7
70——80 80——90 90—100 15 12 4 37.5 30 10 合计 40 100 2)全体职工业务考试成绩的区间范围 成绩组中值 55 65 75 85 95 合计 ??f工人数f 3 6 15 12 4 40?xfXf 165 390 1125 1020 380 3080= (x?x)2f 1452 864 60 768 1296 4440=
??t??2?1.67?3.34xx
x ??x?X?x??x?77?3.34?X?77?3.34 .66?X?80.373
?xf?3080?77x ??f40
????10.52?1.67xn40???(x?x)?f2f?13.34f?1.67 (分)?xf??3)已知:?x2???t = 2 x22t2?222?10.5422(x?x)f? (人) ?160n2?2?21.67?x2
答:(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围73.66---80.3。(3)若其它条件不变,将允许误差范围缩小一半,应抽取160名职工
4、采用简单重复抽样的方法,抽取一批产品中的200件作为样本,其中合格品为195件。要求: (1)计算样本的抽样平均误差
(2)以95.45%的概率保证程度对该产品的合格品率进行区间估计(t=2)
;n1解:已知:1)n?200?195;
p(1?p)97.5(1?97.5)??1.1%n200 n1195p?? ?100%?97.5%;?p?n200
%?2.2%2)已知t=2 ?p?t?p?2?1.104 ??P?p???97.5%?2.2%?P?97.5%?2.2%?p?pp
95.3%?P?99.7%答: 1)样本的抽样平均误差为1.1%
(2)以95.45%的概率保证程度对该产品的合格品率区间为95.3%--99.70% 5、某企业上半年产品产量与单位成本资料如下:
5 / 7