第四节 假设检验的基本原理与方法
4.4.1假设检验的基本思想[理解]
假设检验是除参数估计之外的另一类重要的统计推断问题。它的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发一的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。 例7:某公司想从国外引进一种自动加工装置。这种装置的工作温度X服从
2
正态分布(μ,5),厂方说它的平均工作温度是80度。从该装置试运转中随机测试16次,得到的平均工作温度是83度。该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受?
类似这种根据样本观测值来判断一个有关总体的假设是否成立的问题,就是假设检验的问题。我们把任一关于单体分布的假设,统称为统计假设,简称假设。上例中,可以提出两个假设:一个称为原假设或零假设,记为H0:μ=80(度);另一个称为备择假设或对立假设,记为H1 :μ≠80(度)这样,上述假设检验问题可以表示为:
H0:μ=80 H1:μ≠80
原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。 应该如何作出判断呢?如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对样本值与原假设的差异进行分析。若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。
4.4.2 假设检验规则[识记]
样本既然取自总体,样本均值就必然包含着总体均值μ大小的信息。如上例,若原假设H0:μ=80为真,则|
-80|一般应该小;否则|
-80|一般应较大。因此,我们可以根据|
-80|的大小,也即差异是否显著来决定接受还是拒绝原假设.| -80|越大越倾向于拒绝原假设,那么|
-80|大到何种程度才能作出拒绝原假设的决定呢?为此,就需要制定一个检验规则(简称检验): 当|
-80|≥C时,拒绝原假设H0;当| -80|< C时,接受原假设H0。
其中C是一个特定的参数,称为临界值,不同的C 值表示不同的检验。我们把拒绝原假设H0的范围称为拒绝域,接受原假设H0的范围称为接受域,因此,确定一个检验规则,实质是确定一个拒绝域.
怎样确定拒绝域呢?这涉及假设检验中的两类错误问题。
由于样本具有随机性,因此,根据样本作出判断就有可能犯两类错误,一类错误是原假设是正确的,按检验规则却拒绝了原假设,这类错误称为弃真错误或第 I 类错误,其发生的概率记为α ;另一类错误是,原假设是不正确的而按检验规则接受了原假设,这类错误称为取伪错误或第Ⅱ类错误,其发生的概率记为β。检验决策与两类错误的关系如下:
表4-3、检验决策与两类错误关系表
我们希望犯这两类错误的概率都非常小,由于在一定的样本容量下,α和β 此消彼长,因而奈曼(Neyman)和皮尔生(Pearson)提出一个原则,即在控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率β小。这一原则的含义是,原假设要受到维护,不轻易被否定;若检验结果否定原假设,则说明否定的理由是充分的,同时作出否定判断的可靠程度(即概率)1-α也得到保证。所以在实际问题中,为了通过样本观测值对某一陈述取得强有力的支持,通常把这种陈述本身作为备择假设,而将这种陈述的否定作为原假设。
在推断统计中,这种只控制α而不考虑β的假设检验,称为显著性检验,α称为显著性水平。最常用的α值为0.01、0.05、0.10等。一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误,α取值小些,反之,α取值大些。
上例,给定显著性水平α,当原假设H0:μ=80为真时,则临界值C应满足:
P(|
-80| ≥C ) =α
由于该装置的工作温度 X∽N ( 80 , 5工作温度
服从
N(80,52/16), 令
于是 P(|Z|≥ )=α
由于 Z∽N( 0, 1 ),故
,
统计量
在假设检验中称为检验统计量,把 称为临界值。
2 ),于是,容量n=16的样本的平均当|Z|>临界值 时,拒绝原假设H0;当|Z|<临界值 接受原假设H0 取α=0.05,查表得 =1.96
|Z|=|83-80|/1.25=2.4>1.96
也即统计量Z值落在拒绝域,由此可以认为这种装置的实际平均工作温度与厂方说的有显著差异,故拒绝原假设H0。