应用统计学复习题
集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#
应用统计学复习题
简答题
1.简述普查和抽样调查的特点。 答:
普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点: (1)普查通常具有周期性。
(2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。
(3)普查的数据一般比较准确,规划程度也较高。 (4)普查的使用范围比较窄。
抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点: (1)经济性。这是抽样调查最显着的一个特点。
(2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。 (3)适应面广。它适用于对各个领域、各种问题的调查。 (4)准确性高。
2.为什么要计算离散系数 答:
离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。
对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
3、加权算术平均数受哪几个因素的影响若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样请说明原因。 答:
加权算术平均数受各组平均数喝次数结构(权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构(权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数 ;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。 4.解释相关关系的含义,说明相关关系的特点。 答:
变量之间存在的不确定的数量关系为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。
5.解释抽样推断的含义。 答:
简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。
6.回归分析与相关分析的区别是什么 答:
(1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;(2)对于两个变量X和Y来说,相关分析只能计算出一个反映两个变量间相关密切程度的相关系数,而回归分析可分别建立两个不同的回归方程;(3)相关分析对资料的要求是,两个变量都必须是随机的,而回归分析对资料的要求是自变量是给定的,因变量是随机的。 7.什么是方差分析 答:
方差分析是通过对误差的分析,检验多个总体均值是否相等的一种统计方法。它分为单因素方差分析和双因素方差分析。 8.简述相关分析与回归分析的联系。 答: 相关分析是用于判断两个变量之间相关关系的密切程度,进而对这种判断的可靠程度加以检验的统计方法;而回归分析是分析研究变量之间相关关系的一种统计分析方法,考察一个变量随其余变量变化而变化的情况。相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。 计算题
1.下面是20个长途电话通话时间的频数分布,计算该数据的平均数
通话时间/分钟 4-7 8-11 12-15 16-19 答案: 由题意:
频数 4 5 7 2 通话时间/分钟 20-23 24-27 合计 频数 1 1 20
通话时间/分钟 4-7 8-11 12-15 16-19 4 5 7 2 通话时间/分钟 20-23 24-27 合计 1 1 20 ?xf平均数=
i?166ii=
?fi?1i2.拥有工商管理学位的大学毕业生每年年薪的标准差大约为2000美元,假定希望估计每年年薪底薪的95%置信区间,当边际误差分别500美元时,样本容量应该为多大(???1.96)
2答: n?2?2??/2?2==62
3.某一汽车装配操作线完成时间的计划均值为分钟。由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持分钟的标准是很重要的。一个随机样本由45项组成,其完成时间的样本均值为分钟,样本标准差为分钟。在的显着性水平下检验操作线是否达到了分钟的标准。答案:
根据题意,此题为双侧假设检验问题
(1)原假设H0:?=2.2;备择假设H1:??2.2 (2)构造统计量:U?x??2.39-2.2?6.373 ,得U=s/n0.2/45???1.962
(3)由于??0.05,则查表得:U?/2?U0.025?1.96
(4)6.373?1.96,U>U?/2,所以拒绝原假设,即在的显着水平下没有达到分钟的标准。
4.下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y表示)和他在校学习时的总评分(用x表示)的回归方程。
总评分 解: 2800 3100 3500 3000 3400 3100 6i月薪/美元 2800 3100 3500 总评分 月薪/美元 3000 3400 3100 =18900 7280 10540 12600 9600 11900 8990 62i?Xi?1= ?Yi?16i?Xi?1= ?XY=60910 iii?16 7840000 9610000 9000000 9610000 ?设Y?b0?b1X
b1??XiY?i?16(?Xi)(?Yi)i?1i?166n?(?Xi)2i?16?Xi?162i19.2?189006== 19.2?19.262.18?660910?nb0?Y?b1X=18900/*6=
?于是Y?1290.54?581.08X
5.设总体X的概率密度函数为
其中?为未知参数,X1,X2,...,Xn是来自X的样本。
?(?); (1)试求g(?)?3??1的极大似然估计量g