c.区间估计立足于大概率,通常以较大的可信度(1-a)去估计总体参数的置信区间。假设检验立足于小概率。通常是给定很小的显着性水平a去检验总体参数的先验假设是否正确
二、什么是假设检验中的显着性水平?统计显着是什么意思?
(1)显着性水平是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率,通常用α表示,它是人们根据经验的要求确定的,通常取α=0.05或0.01。显着性水平是人们事先指定的犯第Ⅰ类错误概率α的最大允许值,确定了显着性水平α,就等于控制了第Ⅰ类错误的概率。但犯第Ⅱ类错误 的概率β却是不确定的
(2)统计显着值在原假设为真的条件下,用于检验的样本统计量的值落在了拒绝域内,作出了拒绝原假设的决定
三、什么是假设检验的两类错误及其数理关系怎样
(1)假设检验中所犯的错误有两种:一类错误是原假设为真却别拒绝了,犯这类错误的概率用α表示,也称第Ⅰ类错误。另一类错误是原假设为假却没有拒绝,犯这种错误的概率用β表示,也称第Ⅱ类错误
(2)当α增加时β减小,当β增大时α减小,要使α和β同时减小的唯一办法是增加样本容量
四、假设检验的步骤
(1)陈述原假设H0和备择假设H1。 (2)从所研究的总体中抽出一个随机样本
(3)确定一个适当的检验统计量,并利用样本数据算出其具体数值 (4)确定一个适当的显着性水平,并计算出其临界值,指定拒绝域 (5)将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0,或者也可以直接利用P值作出决策
五、建立原假设和备择假设的原则(建立假设的几点认识)
(1)原假设和备择假设是一个完备事件组,且相互独立
(2)在建立假设时,通常是先确定备择假设,然后再确定原假设
(3)在假设检验中,等号“=”总是放在原假设上。这是因为我们想涵盖备择假设H1不出现的所有情况
(4)这样的假设本质上带有一定的主观色彩,在面对某一实际问题,由于不同研究者有不同的研究目的,即使对同一问题也可能提出截然相反的原假设和备择假设,这并不违背假设的最初定义,只要符合研究的最终目的就是合理的
六、单双侧检验的区别
备择假设具有特定的方向性,并含有“<”或“>”的假设检验,称为单侧检验或单尾检验。
备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验
在单侧检验中,由于研究者感兴趣的方向不同,又可分为左侧检验和右侧检验
七、检验统计量的特征和用途
检验统计量是指根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。
检验统计量实际上是总体参数的点估计量,只有将其标准化后,才能用以度量它与原假设的参数值之间的差异程度。而对点估计量标准化的依据则是:a、原假设H0为真;b、点估计量的抽样分布。实际上,假设检验中所用的检验统计量都是标准化检验统计量,它反映了点估计量与假设的总体参数相比相差多少个标准差。
八、拒绝域面积与??大小的关系
当样本容量固定时,拒绝域的面积随着α的减小而减小。α越小,拒绝原假设所需要的检验统计量的临界值与原假设的参数值就越远。拒绝域的位置取决于检验是单侧检验还是双侧检验,双侧检验的拒绝域在抽样分布的两侧,而单侧检验中,如果备择假设具有符号“<”,拒绝域位于抽样分布的左侧,故称为左侧检验。如果备择假设具有符号“>”,拒绝域位于抽样分布的右侧,故称为右侧检验。
九、显着性水平??的局限性
显着性水平α实在检验之前确定的,这也就意味这我们事先确定了拒绝域。这样,不论检验统计量的值是大还是小,只要他的值落入拒绝域就拒绝原假设,否则不拒绝原假。这种固定的显着性水平α对检验结果的可靠性起一种度量作用。但不足的是,α是犯第Ⅰ类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量,也就是说,仅从显着性水平比较,若选择的α值相同,所有的检验结果的可靠性都一样。
十、P值较小时为什么要拒绝原假设
P值是指在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率。
P值是反映实际观测到的数据与原假设H0之间不一致程度的一个概率值。P值越小,说明实际观测到的数据与H0之间不一致的程度就越大,检验的结果也就越显着
十一、显着性水平??与P值得区别
(1)α的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率,是有人们根据检验的要求确定的,通常α=0.05或0.01 而P值是原假设为真时所得到的样本观察结果或更极端结果出现的概率,它是通过计算得到的,P值得大小取决于三个因素:样本数据与原假设之间的差异、样本量、被假设数据的总体分布
(2)α只能提供检验结论的可靠性地一个大致范围,而对于一个特定的假设检验为题,却无法给出观测数据与原假设之间不一致程度的精确度量。即仅从显着性水平来比较,如果选择的α值相同,所有检查结果的可靠性都一样。 而P值可以测量出样本观察数据与原假设中假设的值的偏离程度。
十二、总体均值的检验
在对总体均值进行假设检验时,采用什么检验步骤和检验统计量取决于我们所抽取的样本是大样本(n≥30)还是小样本(n≤30),此外还需要区分总体是否服从正态分布、总体方差σ2是否已知等几种情况。
(1)大样本的检验方法:样本均值经过标准化后服从正态分布,设假设的总体均值为μ0,当总体方差σ2已知时,总体均值检验的统计量为:
X??00s2来近似代替总体方差,此时总体均值检Z当总体方差未知时,可以用样本方差?~N(0,1)? n验的统计量为X??00( Z2)小样本的检验方法:?~N(0,1)X??SnX??00Z?~N(0,1)因此仍然按照 来计算。
?n 总体方差σ2已知时,即使在小样本下,检验统计量仍然服从正太分布, 总体方差σ2未知时,需要用样本方差s2代替总统方差σ2,此时检验统计
量服从自由度为n-1的t分布。因此需要采用t分布来检验总体均值,通常称为“t检验”。检验的统计量为:
第九章 方差分析与实验设计
一、方差分析的概念及理解
方差分析是指检验多个总体均值是否相等的统计方法。所采用的方法就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显着影响。
它研究的是多哥总统均值是否相等的统计方法,但本质是研究分类型自变量对数值型因变量的影响。
二、方差分析和回归分析的区别和联系
区别:
(1)方差分析中沿水平轴的自变量是分类变量;而回归分析沿水平轴的自变量是数值型变量。
(2)方差分析中,既然自变量是分类变量,就可以把它放在水平轴的任意位置上;而回归分析的自变量是数值型变量,它在水平轴上的位置是从按小到大的数值排列的,因此只有一种方式来放这些数值,并且可以画出一条穿过这些点的直线。
(3)方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显着影响;而回归分析是根据一组样本数据确定出变量之间的数学关系式,然后对关系式的可信程度进行各种统计检验,并找出哪些变量的影响是显着的,哪些不显着等
三、方差分析中的基本原理
(1)方差分析是通过对数据误差来源的分析来判断不同总体的均值是否相等,进而分析自变量对因变量是否有影响
(2)数据的误差是用平方差来表示的,包括组内误差和组间误差
(3)组内误差只包含随机误差,而组间误差既包括随机误差,又包括系统误差 (4)如果组间误差只包括随机误差,而没有系统误差,这时,组间误差与组内误差经过平均后的数值就应该很接近,他们的比值就会接近1;
(5)反之,如果组间误差既包括随机误差又包括系统误差,这时,组间误差与组内误差经过平均后的数值,他们的比值就会大于1;
(6)当这个比值大到某种程度时,我们就可以说因素的不同水平之间存在着显着的差异,也就是自变量对因变量有影响。
四、方差分析中的基本假定
(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本
(2)各个总体的方差必须相同。也就是说,各组观察数据是从具有相同方差的总体中抽取的
(3)观察值是独立的
在上述假定成立的前提下,要分析自变量对因变量是否有影响,实际上也就是要检验自变量的各个水平(总体)的均值是否相等。
五、方差分析和总体均值的t检验或z检验有何不同?优势是什么
(1)不同:总体均值的t检验或z检验,只能研究两个样本,若要检验多个总体
2
均值是否相等。那么作这样的两两比较将 十分繁琐,共需进行Cn次不同的检验,如果
α=0.05,那么每次检验犯第Ⅰ类错误的概率都是0.05,做多次检验会使第Ⅰ类错误的概率相应增加。而方差分析方法则同时考虑所有的样本,因此除了错误累计的概率,从而避免了拒绝一个真是的原假设。
(2)优势:方差分析不仅可以提高检验的概率,同时由于他是将所有的样本信息结合在一起,也增加了分析的可靠性。