总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布 ①样本平均数分布的平均数和方差与母体的平均数和方差有如下关系: ?X????2X???n2
?nX②样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:
Xs??X??2?s??s?2?2n?2
s22n
(2)t分布
t分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t分布当自由度为正无穷时的特例。
总体分布为正态,方差未知时,样本平均数的分布为t分布:
??sn?1nX 其中sn?1?SSn?1
(3)χ2分布
χ2分布的构造是从一个服从正态分布的总体中每次抽去n个随机变量,计算其平方和之后标准化的一个分布。分布曲线下的面积都是1,但伴随着n取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时χ2分布即为正态分布,因此其于t分布一样都是一族分布,而正态分布都是其中的特例。
?2???X???2?2
(4)F分布
如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出χ2,则:
?1F?2df1df2?22
11
更多情况下,我们所计算的F两样本取自相同总体,此时可将上式化简为:
F?snsn21?1?122
(二)参数估计
当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。总体参数估计问题可以分为点估计与区间估计。
1.点估计、区间估计与标准误
良好估计量的标准
①无偏性——用多个样本的统计量估计总体参数的估计值,其偏差的平均数为零
②有效性——当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好
③一致性——当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数 ④充分性——样本的统计量是否充分地反映了全部n个数据所反映总体的信息
点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示
区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,
这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共通变化的,置信区间越大,置信度越高;
区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率。
标准误:样本平均数分布的标准差
总体方差未知时用估算的总体方差计算标准误。
???nX
12
2.总体平均数的估计
x?Z??2X???x?Z??2X
当总体方差未知时,则使用t分布对应置信度 3.标准差与方差的区间估计 (1)标准差的区间估计
sn?1?Z??s???sn?1?Z??s
22
(2)方差的区间估计
?n?1?sn?1??222??2??n?1?sn?1??1???222
(三)假设检验
可以说,每一个实验的存在,仅仅是为了给事实一个反驳虚无假设的机会。 ——R.A.Fisher 1.假设检验的原理
假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异
假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。
(1)两类假设
对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。
备则假设:因变量的变化、差异却是是由于自变量的作用 往往是我们对研究结果的预期,用H1表示。
虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在 观察到的差异只是随机误差在起作用,用H0表示。
13
(2)小概率原理
小概率原理:小概率事件在一次试验中几乎是不可能发生的
至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。在检验过程中,我们假设虚无假设是真实的,同时计算出观测到的差异完全是由于随机误差所致的概率。之后将其与我们实现界定好的显著性水平比较,从而考虑是否依据小概率原理来拒绝虚无假设。
(3)两类错误
(本部分内容请参照实心信号检测论对照来看。 ——MJ注)
Ⅰ型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫α错误
研究者得出了处理有效果的结论,而实际上并没有效果,即所谓“无中生有” Ⅱ型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫β错误 假设检验未能侦查到实际存在的处理效应,即所谓“失之交臂”
两类检验的关系
①α+β不一定等于1
②在其他条件不变的情况下,α与β不可能同时减小或增大
(4)检验的方向性
单侧检验:强调某一方向的检验,显著性的百分等级为α
双侧检验:只强调差异不强调方向性的检验,显著性百分等级为α/2
对于同样的显著性标准,在某一方向上,单侧检验的临界区域要大于双侧检验,因此如果差异发生在该方向,单侧检验犯β错误的概率较小,我们也说它的检验效力更高。
(5)假设检验的步骤
①根据问题要求,提出虚无假设和备择假设 ②选择适当的检验统计量
③确定检验的方向性并规定显著性水平 ④计算检验统计量的值
⑤将统计量的值与临界值对比做出决策 2.样本与总体平均数差异的检验 (1)总体正态分布且方差已知
zobs?X??0?其中?X??0n
X 14
?0和?0分别为总体的平均数和方差
(2)总体正态分布而方差未知
tobs?X??0sX其中sX?Sn而S?SSn?1 S为用样本和方估算出的总体方差
3.两样本平均数差异的检验
Zobs?tobs?X1?X2?这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算
DX(1)总体方差已知 ①独立样本
???12DXn1??2n22 ②相关样本
???1??2?2r?1?2n22DX其中r为两组变量之间的相关系数
(2)总体方差未知
①独立样本(方差差异不显著时)
?DX?n1s1?n2s222n1?n2?2?n1?n2n1n2
②相关样本
a.相关系数未知:?DX??d2????dn2n?n?1?s1?s2?2rs1s2n?122其中d为每一对对应数据之差
b.相关系数已知:?DX? 15