www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台
第11章 推断统计原理和SPSS应用概述
1.名词解释
必然现象,随机现象,推断统计,概率分布,抽样分布,参数检验,非参数检验,假设检验,离散型随机变量,连续型随机变量,正态分布,二项分布,t分布,χ2分布,F分布,Ⅰ类错误,Ⅱ类错误,点估计,区间估计,固定因素,随机因素,协变量,方差分析,多重比较,一般线性模型
答:(1)必然现象:又称确定性现象,是在一定条件下有确定结果的现象。
(2)随机现象:在一定条件下进行试验或观察会出现不同的结果,而且在每次试验之前都无法预言会出现哪一个结果的现象。
(3)推断统计:根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
(4)概率分布:是概率论的基本概念之一,用以表述随机变量取值的概率规律。根据随机变量所属类型的不同,概率分布取不同的表现形式。
(5)抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
(6)参数检验:是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
(7)非参数检验:在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
1 / 10
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 (8)假设检验:又称显著性检验,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
(9)离散型随机变量:变量取值只能取离散型的自然数。
(10)连续型随机变量:变量可以在某个区间内取任一实数即变量的取值可以是连续的。
(11)正态分布:又称高斯分布,是一种概率分布。即是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,记作N(μ,σ2)。
(12)二项分布:是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。
(13)t分布:是一种随机变量函数的分布,应用在当对呈正态分布的母群体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t测定的基础。
(14)χ2分布:即卡方分布,n为卡方分布的自由度,决定卡方分布曲线族的形状和位置。卡方统计量始终为非负数,因此曲线只出现在直角坐标系的第一象限,随着自由度增大,卡方分布由正偏态趋于正态分布,其均值和标准差分别为df和2df。
(15)F分布:F分布有两个参数,n1是分子自由度,n2是分母自由度,随着两个自由度增大,F分布亦由正偏态趋于正态分布,其均值和标准差分别为n2/(n2-2)和(n1+n2-2)/n1(n1-2)2(n2-4)。
(16)Ⅰ类错误:指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α表示。
(17)Ⅱ类错误:指接受了实际上不成立的H0,这类“存伪”的误称为Ⅱ型错误,其概率大小用β表示。
2 / 10
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 (18)点估计:又称定值估计,是用实际样本指标数值作为总体参数的估计值。 (19)区间估计:是在一定概率保证下给出总体参数的可能范围,所给出的可能范围叫置信区间,给出的概率保证成为置信度或置信概率。
(20)固定因素:指该因素在样本中所有的可能的水平都出现了,该因素的所有可能水平仅此几种,针对该因素,从样本的分析结果可以得知所有水平的状况,无需进行外推。
(21)随机因素:指的是该因素所有可能的取值在样本中没有都出现,或不可能都出现。
(22)协变量:指一些与应变量、自变量可能都有关系的连续性变量。它们的存在可能影响分析结果的正确性,要加以控制,此类分析称为协方差分析。
(23)方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
(24)多重比较:用在变异数分析之后,若发现平均数有显著差异时,则再从所处理的实验水准中检视一对或多对平均数间是否有差异存在,这种工作常须比较好几对平均数的差异,就叫做多重比较。
(25)一般线性模型:是对多元回归的发展,即它是进行方差/协方差分析的通用程序,其功能大体相当于多元方差/协方差分析。
2.如何理解概率分布及其种类间的差异? 答:(略)
3.例11-7中,假设问题条件发生变化,该测验是韦克斯勒智力测验,其总体均值和
3 / 10
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 标准差分别为100和15,且测验总体服从正态分布。问题应如何解决?如何在SPSS中实现?考虑到大样本的情况又应如何解决?
答:(略)
4.简述二项分布、正态分布及其特点。
答:(1)二项分布:是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。
二项分布的特点如下:
①二项分布的均值为np,方差为npq。
②以事件A出现的次数为横坐标,以概率为纵坐标,画出二项分布的图象,可以看出: a.二项分布是一种离散性分布;
b.当p=q=0.5时,图象对称;当p不等于q时,图形是偏斜的。p>q时,呈负偏态。一般1/2np>=5且nq>=5时,二项分布就非常接近正态分布。
(2)正态分布:又称高斯分布,是一种概率分布。即是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,记作N(μ,σ2 )。
正态分布的特点如下:
①正态分布的形式是对称的,它的对称轴是过平均数点的垂直线,即关于x=u对称。 ②曲线在Z=0处为最高点,向左右延伸时,在正负1个标准差之内,既向下又向内弯。从正负1个标准差开始,既向下又向外弯。拐点位于正负一个标准差处,曲线两端向靠近基线处无限延伸和接近,但不相交。
③正态分布下的面积为1,过平均数的垂直线将面积分为左右各0.50的部分。正态曲
4 / 10
www.100xuexi.com 圣才电子书 十万种考研考证电子书、题库视频学习平台 线下的每一面积都可以被看成是概率,即对应着横坐标值的随机变量出现的概率。
④正态分布是一族分布,它随着随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。但是所有的正态分布都可以通过公式Z=(Xl—M)/S,转换成标准正态分布,即平均数为0,标准差为1的正态分布。
⑤在正态分布曲线中,标准差与概率(面积)有一定的关系。
5.试简述各种抽样分布的概念和特点。 答:(1)样本均值的抽样分布
设一总体平均数为μ,方差为σ2称该总体为母总体。现从该总体中随机抽取容量为n的样本,样本平均数记为x,则称该样本平均数的概率分布为均值抽样分布。通常记该分布的平均数和标准差为的大小。
随着样本容量的增大,抽样分布的标准误越来越小(因而峰度越来越高),因此,可以通过增大抽样的样本容量来降低样本平均数的抽样误差。若母总体X~N(μ,σ2),则其相应的均值的抽样分布始终是正态分布,即~N(μ,σ2/n);若样本容量足够大(大样本),不论母总体分布如何,只要总体参数有限且总体容量至少是样本容量的2倍,则均值抽样分布近似正态。
(2)比例的抽样分布
假设总体无限,某事件A成功概率为p,失败概率为q=1-P,从中抽取容量为n的样本(即n次二项试验),则对A事件发生的比例P(成功次数x/样本容量n)的抽样分布。
事件A成功次数x的均值np和标准差
同这里抽样分布的均值和标准差仅仅是单
其中,称
为抽样分布的标准误(SE),表示平均数抽样误差
位不同。特别地,大样本时(np或nq较小者≥5)该抽样分布为渐近正态分布。同样,当总
5 / 10