7. 假设检验依据的基本原理是什么?
假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中几乎不可能发生。
8. 在单侧检验中原假设和备择假设的方向应该如何确定?
将研究者想要收集证据予以支持的假设作为备择假设??1,将研究者想要收集证据证明其不正确的假设作为原假设??0。先确立备择假设??1,备择假设方向与想要证明其正确性的方向一致。原假设与备择假设是互斥的,等号总在原假设上。
第九章 分类数据分析
1. 简述列联表的构造与列联表的分布。
构造:列联表是由连个以上的变量进行交叉分类的频数分布表。
分布:列联表的分布可以从两个方面看:一个是观察值的分布,一个是期望值的分布。
观察值:条件频数、行边缘频数、列边缘频数、百分比。
期望值分布:根据比例求出的各个变量的期望值,一般情况下,任何一个单元中频
数的期望值:????=
??????
×
??????
×??=
????×????
??
其中,????为给定单元格所在行的合计,????为给定单元格所在列的合计,??为观察值
总个数,即样本容量。
2. 说明计算??2分统计量的步骤。
若用??0表示观察值频数,用????表示期望值频数,??2统计量可表示为??2=∑(??0?????)2/??0
步骤一:计算??0????? 步骤二:计算(??0?????)2 步骤三:计算(??0?????)2/??0
步骤四:计算??2=∑(??0?????)2/??0
3. 简述??系数、??系数、??系数各自的特点。
??系数:描述2×2列联表数据相关程度最常用的一种相关系数,计算公式为??=
√??2/??。此时??系数的取值是在0到1之间,且??的绝对值约达,说明变量的相关程度越大,但当列联表的行数??或列数??大于2时,??系数将随着其变动而增大且没有上限。
??系数:主要用于大于2×2列联表的情况,计算公式为??=
??2
。相互独立时,系??2+??
数为0,不可能大于1,其可能的最大值依赖于列联表的行数和列数,且随着行数??
和列数??的增大而增大。根据不同的行和列计算的列联相关系数不便于比较。 ??系数:V=
??2
√??×??????{(???1),(???1)},取值在0到1之间。
第十章 方差分析
1. 什么是方差分析?它研究的是什么?
方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。他所研究的是分类型自变量对数值型因变量的影响。 2. 要检验多个总体均值是否相等时,为什么不做两两比较,而用方差分析方法?
作两两比较十分繁琐,进行检验的次数较多,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加,而方差分析法则是同时考虑所有的样本,因此排除了错误累计的概率,从而避免拒绝了一个真实的原假设。 3. 方差分析包括哪些类型?它们有何区别?
类型:单因素方差分析和双因素方差分析。
区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因素方差分析设计两个分类型自变量。 4. 方差分析中有哪些基本假定?
每个总体都应服从正态分布;各个总体的方差必须相等;观测值是独立的。 5. 简述方差分析的基本思想。
它是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。 6. 解释因子和处理的含义。
在方差分析中,所要检验的对象称为因素或银子,因素的不同表现称为水平或处理。 7. 解释组内误差和组间误差的含义。
组内误差(SSE)是指每个水平或组的各个样本数据与其组平均值误差的总和,反映了每个样本内观测值的离散状况,组内误差只含有随机误差;组间误差(SSA)是指各组平均值与总平均值的误差平方和,反映个样本均值之间的差异程度。 8. 解释组内方差和组间方差的含义。
组内方差(MSE)指因素的同一水平下样本数据的方差;组间方差(MSA)是指因素的不同水平下各个样本之间的方差。 9. 简述方差分析的基本步骤。
①提出假设:??0:??1=??2=···=????=···=????
??1:????(??=1,2,···,??)不全相等
②构造检验统计量:计算各样本均值,计算全部观测值的均值,计算各误差平方和,计算统计量。
③统计决策:将统计量的值与给定的显著性水平下的临界值进行对比,做出对原假设的决策。
10. 方差分析中多重比较的作用是什么?
通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。 11. 什么是交互作用?
交互作用是指几个因素搭配在一起会对因变量产生一种新的效应的作用。 12. 解释无交互作用和有交互作用的双因素方差分析。
在双因素方差分析中,如果两个因素对试验结果的影响是相互独立的,这时的双因素方差分析称为无交互作用的双因素方差分析;如果出了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析。 13. 解释??2的含义和作用。
含义:组间平方和(SSA)占总平方和(SST)的比例记为??2。 作用:其平方根就可以用来测量两个变量之间的关系强度。
第十一章 一元线性回归
1. 解释相关关系的含义,并说明相关关系的特点。
含义:变量之间存在的不确定的数量关系为相关关系。
特点:一个变量的取值不能由另一个变量唯一确定,当变量??取某个值时,变量??的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。 2. 相关分析主要解决哪些问题?
变量间是否存在关系;如果存在,是什么样的关系;变量之间的关系强度如何;样本所反映的变量之间的关系能否代表总体变量之间的关系。 3. 相关分析中有哪些基本假定?
两个变量之间是线性关系;两个变量都是随机变量。 4. 简述相关系数的性质。
公式:??=
??∑?????∑??????√??????2?(????)2√??????2?(????)2 性质:?1≤??≤1;对称性;??的大小与??和??的原点及尺度无关;??仅仅是??与??之间线性关系的一个度量,不能用于描述非线性关系;??虽然是两个变量之间线性关系的一个度量,不意味着??和??一定有因果关系。 5. 为什么要对相关系数进行显著性检验?
在对实际现象进行分析时,往往是利用样本数据计算相关系数作为总体相关系数的估计值,但由于样本相关系数具有一定的随机性,它能否说明总体的相关程度往往同样本容量有一定关系。因此需要对相关系数进行显著性检验,若在统计上是显著的,说明它可以作为总体相关程度的代表值,否则不能作为总体相关程度的代表值。 6. 简述相关系数显著性检验的步骤。
提出假设:??0:??=0 ??1:??≠0
计算检验的统计量:??=|??|√1???2~??(???2)
进行决策:确定显著性水平,若??>????/2,拒绝原假设。 7. 解释回归模型、回归方程、估计的回归方程的含义。
回归模型:描述因变量??如何依赖自变量??和误差项??的方程称为回归模型,表示为:??=??0+??1??+??。
回归方程:描述因变量??如何依赖自变量??的方程称为回归方程,表示为:??(??)=??0+??1??。
估计的回归方程:根据样本数据求出的回归方程,表示为:
?0+???1?? ???=??
8. 一元线性回归模型中有哪些基本假定?
因变量??与自变量??具有线性关系;在重复抽样中,自变量??的取值是固定的,即假设??是非随机的;误差项??是一个期望值为0的随机变量;对于所有的??值,??的??2都相同;误差项??是一个服从正态分布的随机变量,且独立,即??~??(0,??2)。 9. 简述参数最小二乘估计的基本原理。
对于??和??的??对观测值,用距离各观测点最近的一条直线来代表??和??之间的关系与实际数据的误差比其他任何直线都小。即使因变量的观测值与估计值之间的离差平
?0和???1。 方和达到最小来估计??
???2
10. 解释总平方和、回归平方和、残差平方和的含义,并说明他们之间的关系。
总平方和:对一个具体的观测值来说,变差的大小可以用实际观测值??与其均值???之差(??????)来表示,而??次观测值的总变差可由这些离差的平方和来表示,称为总平方和(SST)。
回归平方和:由于自变量??的变化引起的??的变化,而其平方和反映了??的总变差中由于??与??之间的线性关系引起的??的变化部分,它是可以由回归直线来解释的变差部分,称为回归平方和(SSR)。
残差平方和:除了??对??的线性影响之外的其他因素对??变差的作用,是不能由回归直线来解释的变差部分,称为残差平方和(SSE)。 关系:SST=SSR+SSE
11. 简述判定系数的含义和作用。
含义:判定系数是对估计的回归方程拟合优度的度量。
作用:判定系数??2测度了回归直线对观测数据的拟合优度,取值范围[0,1];越接近1,表明回归平方和占总平方和的比例越大,拟合优度越好;反之,越接近于0,回归直线的拟合程度就越差。
12. 在回归分析中,??检验和??检验各有什么作用?
??检验:线性关系检验。 ??检验:回归系数检验。
13. 简要说明残差分析在回归分析中的作用。
判断对误差项??的假定是否成立。
第十二章 多元线性回归
1. 解释多远回归模型、多元回归方程、估计的多元回归方程的含义。
多元回归模型:设因变量为??,??个自变量分别为??1,??2,···,????,描述因变量??如何依赖于自变量??1,??2,···,????和误差项??的方程称为多元回归模型,表示为:??=??0+??1??1+??2??2+···+????????+??。 多元回归方程:描述因变量??的期望值与自变量??1,??2,···,????之间关系的方程,表示为:E(??)=??0+??1??1+??2??2+···+????????
?0,???1,???2,···,?????去估计回归方程中的未知参数得估计的多元回归方程:用样本统计量??
?0+???1??1+???2??2+···+????????? 到,表示为: ???=??
2. 多元线性回归模型中有哪些基本假定?
误差项??是一个期望值为0的随机变量;对于自变量??1,??2,···,????的所有值,??的方差??2相同;误差项??是一个服从正态分布的随机变量,且独立,即??~??(0,??2)。 3. 解释多重判定系数和调整的多重判定系数的含义和作用。
多重判定系数:多元回归中的回归平方和占总平方和的比例。
作用:是度量多元回归方程拟合程度的一个统计量,反映了在因变量??的变差中被估计的回归方程所解释的比例。
2
调整的多重判定系数:????=1?(1???2)
???1
??????1
22
作用:用样本容量和自变量的个数调整??2得到,使得????永远小于??2且????的值不会随着模型自变量的增加而越来越接近1。 4. 解释多重共线性的含义。
回归模型中两个或以上的自变量彼此相关时,称回归模型中存在多重共线性。
5. 多重共线性对回归分析有哪些影响?
变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途;可能对参数估计值的正负号产生影响;特别是??1的正负号有可能同预期的正负号相反。 6. 多重共线性的判别方法主要有哪些?
模型中各对自变量显著相关;当模型的线性关系检验显著时,几乎所有回归系数的
2
检验却不显著;回归系数的正负号与预期相反;容忍度(1?????)越小,多重共线性
越严重,当小于0.1时,存在严重的多重共线性;方差扩大因子(??????=
1
2)越大,1?????
多重共线性越严重,当大于10时,存在严重的多重共线性。
7. 多重共线性的处理方法有哪些?
将一个或多个自变量从模型中剔除,使保留的自变量尽可能不相关;如果保留所有自变量,那就应该①避免根据??统计量对单个参数进行检验②对因变量的推断限定在自变量样本值的范围内。
8. 在多元线性回归中,选择自变量的方法有哪些?
向前选择;向后剔除;逐步回归;最优子集。
第十三章 时间序列分析和预测
1. 简述时间序列的构成要素。
趋势、季节性、周期性、随机性。
2. 利用增长率分析时间序列时应注意哪些问题?
当时间序列中的观测值出现0或负数时,不宜计算增长率;不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其疑难的绝对值可能很大。 3. 简述平稳序列和非平稳序列的含义。
平稳序列:基本上不存在趋势的序列,各观测值基本在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的。
非平稳序列:是包括趋势、季节性或周期性的序列。它可能只含有一种成分,也可能是几种成分的组合。 4. 简述时间序列的预测程序。
确定时间序列所包含的成分;找出适合此类时间序列的预测方法;对可能的预测方法进行评估,以确定最佳预测方案;利用最佳预测方案进行预测。 5. 简述指数平滑法的基本含义。
指数平滑法是指对过去的观测值加权平均进行预测的一种方法。该方法使得第??+1期的预测值等于??期的实际观察值与第??期预测值的加权平均数。指数平滑法是加权平均的一种特殊形式,观察值时间越远,其权数也跟着呈指数下降,因而称为指数平滑。指数平滑法有一次指数平滑法、二次指数平滑法、三次指数平滑法。一次指数平滑法也可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势。 6. 简述复合型时间序列的预测步骤。
确定并分离季节成分,建立预测模型并进行预测,计算最后的预测值。 7. 简述季节指数的计算步骤。
计算移动平均值,计算移动平均值的比值,季节指数调整。
第十四章 指数
1. 什么是指数?它有哪些性质?
含义:广义上,是指任何两个数值对比形成的相对数;狭义上,是指用于测定多个项目在不同场合下综合变动的一种特殊相对数。
2. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
含义:是指若干度量单位不同,不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。
作用:同度量因素在计算总指数的过程中,对各因素起着权衡轻重的作用,所以也叫权数。
3. 拉氏指数与帕氏指数各有什么特点?
拉氏指数:在计算综合指数时将作为权数的同度量因素固定在基期。 帕氏指数:在计算综合指数时将作为权数的同度量因素固定在报告期。
4. 加权平均指数与加权综合指数有何区别与联系?
加权平均指数:以个体指数为基础,通过对个体指数进行加权平均来编制的指数。 加权综合指数:通过加权来测定一组项目的综合变动,有加权数量指数和加权质量指数。
区别:思路上,加权综合指数是先综合,后对比,而加权平均指数是先对比,后综合;运用资料上,加权综合指数需要研究总体的全面资料,加权平均指数对资料要求比较灵活;经济分析中的具体作用上,加权指数方法主要用于价格指数的计算。 5. 什么是指数体系?它有什么作用?
含义:是由总量指数及其若干个因素指数构成的数量关系式。
作用:指数体系是进行因素分析的根据;利用各指数之间的联系进行指数间的相互推算;用综合指数法编制总指数时,指数体系也是确定同度量因素时期的根据之一。 6. 试述平均数指数体系。
总平均水平指数:??????=???1=????1??1∕????1 0
00
0
?????????∕????
组水平变动指数:????=结构变动指数:????=
????????0
???1?????
=
????1??1∕????1
????0??1∕????1
=
????0??1∕????1
????0??0∕????0
总平均水平指数=组水平变动指数×组水平变动指数 总水平变动额=各组水平变动影响额+结构变动影响额 7. 构建综合评价指数时需要考虑哪些方面的问题?
建立综合评价指数体系;确定各项指标的评价标准;确定各项评价指标的权重;选择评价指标的合成方式。