www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台
第十章 定量资料分析
一、单项选择题
要在总共3000名学生的某大学中,抽取一个容量为100的大学生样本。要求采用系统抽样的方法抽样,先将这3000名学生的名单依次编上号码,如果抽取的第一个样本编号为12,则最后一个样本的编号是( )。[中央财经大学2011年研]
A.2970 B.2982 C.2994 D.3000 【答案】B
【解析】系统抽样中,抽样间距K=N(总体规模)/n(样本规模)。在抽样框中,自A(A为抽样的起点)开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,…,A+(n-1)K。所以,题目中K=3000÷100=30,最后一个样本的编号为:12+(100-1)×30=2982。
二、概念题 1.离差
答:离差又称差量,是指单项数值与平均值之间的差。一般计算离差平方和来表示数据分布的集中程度,反映了估计量与真实值之间的差距。可能出现结果与平均预期的偏离程度,
1 / 19
www.100xuexi.com 代表风险程度的大小。
2.全距
圣才电子书 十万种考研考证电子书、题库视频学习平台 答:全距又称为极差,是对定序及定序以上尺度的变量离散程度的测量,用来表示统计资料中的变异量数。全距是指最大观察值与最小观察值间的差。极差越小表明资料分布越集中。但由于它的值是由端点的差决定的,因此个别远离群体的极值会极大改变极差,以至使它不能真实反映资料的分散程度。
3.χ2检验[北京科技大学2011年研]
答:χ2检验是检验两个变量之间相关关系的一个统计量。χ2检验的具体步骤是:首先,建立两变量间无关系的假设。然后计算出χ2值。再根据自由度df=(r-1)(c-1)和给出的显著性水平,即P值,查χ2分布表,得到一临界值。自由度计算公式中的r和c分别为交互分类表的行数和列数。将计算出的χ2值与查得的临界值进行比较,若χ2值大于或等于临界值,则称差异显著,并拒绝两变量独立的假设,也即承认两变量间有关系;若χ2值小于临界值,则称差异不显著,并接受两变量独立的假设,即两变量间无关系。
4.小概率原理[中央财经大学2013、2012年研]
答:小概率原理,是指“小概率事件在一次观察中不可能出现,但在多次重复试验中是必然发生的”的原理。它是假设检验所依据的理论。如果现实的情况恰恰是在一次观察中小概率事件出现了,就应该怀疑和否定该事件的概率未必很小,即认为该事件本身不是一种小概率事件,而是一种大概率事件。这正是假设检验的基本思想。
2 / 19
www.100xuexi.com 5.单尾检验
圣才电子书 十万种考研考证电子书、题库视频学习平台 答:单尾检验又称单边检验,与双边检验相对应。如果拒绝域是位于抽样分布的两端的,就是双边检验,如果拒绝域位于抽样分布一端的,就是单边检验。如果是位于右端就称为右侧单边检验,如果是左边就称为左侧单边检验。一般来说,双边检验较单边检验更难否定H0,因此在提出备择假设时,最好说明方向。
6.阐明分析[北京科技大学2014年研]
答:阐明分析又称“因果环节分析”,是指探求自变量(x)为什么会影响因变量(y)的一种统计学分析。阐明分析的目标是探讨因果关系的作用方式或作用途径。即当变量x与变量y相关时,通过引进并控制第三变量,以判明自变量x是否“通过”第三变量而对因变量y产生影响。如果控制了第三变量,原来两个变量之间的关系消失了,那么可以说,这个第三变量是x与y之间因果相连的关键环节,即变量x是通过第三变量影响变量y的。如果控制第三变量后,原来两个变量之间的关系没有改变,则可以认为x并非通过第三变量影响y的。
三、判断题
中位值是用来度量变量的离散趋势的。[中央财经大学2013年研] 【答案】错误
【解析】中位数是把一组数据按值的大小顺序排列起来,处于中央位置的那个数值。它所描述的是定序变量以上层次的变量,是用来度量集中趋势的。
四、简答题
3 / 19
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 1.简述在构建测量相关性的统计指标中的PRE准则。
相关试题:“PRE”含义[概念题,浙江大学2007年研;北京科技大学2014年研] 答:消减误差比例(proportionate reduction in error,PRE)是指知道X的值时所减少的误差(E1-E2)与总误差的比。
用公式表示为:PRE=(E1-E2)/E1
PRE越大,表示以X值去预测Y值时能够减少的误差所占的比例越大。换句话说,X与Y之间就越是相关,或者说,X与Y的关系越强。比如说,PRE=0.70,表示以X预测Y时能减少70%的误差,说明二者之间的相关程度较高;而PRE=0.09,则表示只能消减9%的误差,即X与Y之间的关系微弱。
2.试答方差分析中TSS、RSS、BSS的含义。 答:(1)TSS的含义
TSS称为总离差平方和,表示全体观测值对总平均数(推测值)的离差平方和。其计算公式为:
TSS=??yij?yi?1j?1mni??2
(2)RSS的含义
RSS称为组内离差平方和,表示各观测值对本组平均数的离差平方和,它不是由自变量而是由其他未知因素引起的。其计算公式为:
RSS???yij?yi?1j?1mnij??2
(3)BSS的含义
BSS称为组间离差平方和,表示各组的平均数与总平均数的离差的平方和。它是由于自
4 / 19
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 变量值的不同引起的差异。其计算公式为:
BSS?TSS?RSS??niyi?yi?1m??
2
3.简述数据清理的方法。
答:数据清理工作是在计算机的帮助下进行的,通常有下列几种方法: (1)有效范围清理
对于问卷中的任何一个变量来说,它的有效的编码值往往都有某种范围,而当数据中的数字超出了这一范围时,可以肯定这个数字一定是错误的。要检查出所有不符合要求的编码值,我们只需在计算机上,用SPSS软件(或其他软件)执行一条统计各变量频数分布(frequency)的命令。
(2)逻辑一致性清理
逻辑一致性清理是从另一种角度来查找数据中所存在的问题。其基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。要查找和清理有上述错误的个案,需要在SPSS软件中执行条件选择命令(IF)。逻辑一致性清理还可以采取SPSS中构成新变量的命令(即compute命令)来进行。
(3)数据质量抽查
尽管采取了上述两种方法对数据进行清理,但仍会有一些错误的数据无法查出来。作为一种妥协,人们往往采用随机抽样的方法,从样本的全部个案中,抽取一部分个案,进行这种形式的校对工作。用这一部分个案校对的结果,来估计和评价全部数据的质量。
4.辨析:标准差与标准误。[中央财经大学2014年研]
5 / 19