第七章 假设检验
学习目标
知识目标:
理解假设检验的基本概念小概率原理;掌握假设检验的方法和步骤。
能力目标:
能够作正态总体均值、比例的假设检验和两个正态总体的均值、比例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。当然由于样本的随机性,这种推断只能具有一定的可靠性。本章介绍假设检验的基本概念,以及假设检验的一般步骤,然后重点介绍常用的参数检验方法。由于篇幅的限制,非参数假设检验在这里就不作介绍了。
第一节 假设检验的一般问题
关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误
一、假设检验的基本概念 (一)原假设和备择假设
为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。
例 某厂生产一种日光灯管,其寿命X服从正态分布N(?, 2002),从过去的生产经验看,灯管的平均寿命为??1550小时,。现在采用新工艺后,在所生产的新灯管中抽取25只,测其平均寿命为1650小时。问采用新工艺后,灯管的寿命是否有显著提高这是一个均值的检验问题。灯管的寿命有没有显著变化呢这有两种可能:一种是没有什么变化。即新工艺对均值没有影响,采用新工艺后,X仍然服从
N(1550, 2002)。另一种情况可能是,新工艺的确使均值发生了显著性
变化。这样,X?1650和?0?1550之间的差异就只能认为是采用新工艺的关系。究竟是哪种情况与实际情况相符合,这需要作检验。假如给定显著性水平??0.05。
在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。第一个统计假设??1550表示采用新工艺后灯管的平均寿命没有显著性提高。第二个统计假设??1550表示采用新工艺后灯管的平均寿命有显著性提高。这第一个假设称为原假设(或零假设),记为H0:??1550;第二个假设??1550称为备择假设,记为H1:
??1550。至于在两个假设中,采用哪一个作为原假设,哪一个作为
备择假设,要看具体的研究目的和要求而定。假如我们的目的是希望从子样观察值对某一陈述取得强有力的支持,则把该陈述的否定作为原假设,该陈述本身作为备择假设。譬如在上例中,我们的目的当然是希望新工艺对产品寿命确有提高,但又没有更多的数据可以掌握。为此,我们取“寿命没有显著性提高(??1550)”作原假设,而以“寿命有显著性提高(??1550)”作为备择假设。
(二)检验统计量
假设检验问题的一般提法是:在给定备择假设H1下对原假设H0
作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则就接受原假设H0。在拒绝原假设H0或接受备择假设H1之间作出某种判断,必须要从子样(X1,X2,?,Xn)出发,制定一个法则,一旦子样
(x1,x2,?,xn)的观察值确定之后,利用我们制定的法则作出判断:拒绝
原假设H0还是接受原假设H0。那么检验法则是什么呢它应该是定义在子样空间上的一个函数为依据所构造的一个准则,这个函数一般称
为检验统计量。如上面列举的原假设H0:???0(?0?1550),那么子样均值X就可以作为检验统计量,有时还可以根据检验统计量的分布进一步加工,如子样均值服从正态分布时将其标准化,Z?X??0?/n作为
检验统计量,简称Z检验量。或者在总体方差?2未知的条件下,
t?X??0Sn/n作为检验量,称为t检验量。
(三)接受域和拒绝域
假设检验中接受或者拒绝原假设H0的依据是假设检验的小概率原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中几乎是不可能发生的,根据这一原理就可以作出接受或是拒绝原假设的决定。如,一家厂商声称其某种产品的合格率很高,可以达到99﹪,那么从一批产品(如100件)中随机抽取一件,这一件恰好是次品的概率就非常之小,只有1﹪。如果把厂商的宣称,即产品的次品率仅为1﹪作为一种假设,并且是真的。那么由小概率原理,随机抽取一件是次品的情形就几乎是不可能发生的。如果这种情形居然发生了,这就不能不使人们怀疑原来的假设,即产品的次品率仅为1﹪的假设的正确性,这时就可以作出原假设为伪的判断,于是否定原假设。
接受域和拒绝域是在给定的显著性水平?下,由检验法则所划分的样本空间的两个互不相交的区域。原假设H0为真时的可以接受的可能范围称为接受域,另一区域是当原假设H0为真时只有很小的概
率发生,如果小概率事件确实发生,就要拒绝原假设,这一区域称为拒绝域(或否定域)。落入拒绝域是个小概率事件,一旦落入拒绝域,就要拒绝原假设而接受备择假设。那么应该确定多大的概率算作小概率呢这要根据不同的目的和要求而定,一般选择0.05或者0.01,通常用?表示。它说明用多大的小概率来检验原假设。显然?愈小愈不容易推翻原假设,而一旦拒绝原假设,原假设为真的可能性就越小。所以在作假设检验时通常要事先给定显著性水平?.(1??称为置信水平)。图7-1所示Z检验时的拒绝域和接受域。
(四)假设检验中的两类错误
由前面已知,假设检验是在子样观察值确定之后,根据小概率原理进行推断的,由于样本的随机性,这种推断不可能有绝对的把握,不免要犯错误。所犯错误的类型有两类:一类错误是原假设H0为真时却被拒绝了。这类错误称为弃真错误,犯这种错误的概率用?表示,所以也叫?错误或第一类错误。另一类错误是指原假设H0为伪时,却