第四章 检验
9.1 检验问题
9.1.1 一个例题
9.1.2 有关检验的两种错误
第一类错误(type one error) : 第二类错误 (type two error) : 9.1.3 假设检验的手续
第一步:建立原假设和备择假设; 第二步:构筑检验统计量;
第三步:根据有意水准,查出临界值; 第四步: 比较第二步和第三步的结果。 9.1.4 两种错误之间的关系
9.2 比率检验
?? 比率检验问题基于样本比率px进行检验。 n9.2.1 比率检验
例题: 一种新药,它的宣传广告上说具有80%的病人用过以后会有效果。现在让150人试用,结果109人觉得有效果。这个广告宣传的正确与否?
x109,n?150 已知:样本指标 p??n150 总体指标 ??80%
两侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。
xx H0:p????80%;H1:p??80%.
nn 第二步:构筑检验统计量。
知道总体的期望和方差,可以直接使用正态分布。
z?p?80%?(1??)n??2.25
这个检验统计量在原假设成立的情况下,应该服从
???1????p~N??,?。
n?? 第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。 查书后面的z,得到z?1.96
第四步: 比较第二步和第三步的结果。
1
z?p?80%?(1??)n??2.25<-1.96
=====> 我们无法接受原假设。
9.2.2 比率差的检验
目的:检验两个母体具有某种特性的比例是否相等,它们的均值是否相等,或者属于同一母体。
一般来说,两个样本之间会有一定的差距,我们关心的是这个差距是由总体不同而带来的,还是由抽样过程中产生的误差所致?
?2,n2。在n1,n2很大的时候,?1,n1;样本2:p一般,假设样本1:p?1?p?2~N?,?2,其中,??p1?p2,p1为总体1的期望,p2为总体2的期p望;?2???p1?1?p1?p2?1?p2?。 ?n1n2例题:想检验性别问题对《物权法》的支持程度。现在抽取1200名男性人
大代表,发现有432名支持《物权法》;抽取900名女性人大代表,发现有276名支持。请问支持率与性别有关系吗?
432276?男??女?,p已知:样本指标 p
1200900A. 两侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。
H0:p1?p2 ; H1:p1?p2 。
第二步:构筑检验统计量。
没有总体的期望和方差,本应该使用t分布,但样本数很大,所以还是使用正态分布。
在H0:p1?p2正确的基础上,?2?p?1?p?(11?),其中,n1n2p?x1?x2432?276 。 ?n1?n21200?900x1x2???p1?p2?n1n2?11?p?1?p????nn??2??1z??2.56
第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。
2
查书后面的标准正态分布,得到z?1.96 第四步: 比较第二步和第三步的结果。 2.56〉1.96
=====> 我们无法接受原假设。
9.3 平均值的检验
平均值检验问题是基于样本均值x的分布而进行的检验。如果总体服从于正态分布的话,样本的均值就服从于正态分布;如果总体不服从于正态分布的话,在样本数很大的情况下,样本的均值也渐进地服从于正态分布。
9.3.1 根据正规分布进行平均值的检验
条件:总体方差是已知的,或者虽然不知道总体方差,但是样本数很大。
??2x~N???,n???? ?情况A 总体方差知道。
例题:一家工厂生产直径为1厘米的轴承,按标准偏差为0.03厘米进行管理。一天,从产品中抽取10个产品作样品,测定的结果是:样本平均直径为0.978厘米。可不可以认为产品质量上出现异常?
已知: 总体指标 ??1cm,SD?0.03cm ; 样本指标 x?0.978cm
两侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。
H0:x?? ; H1:x??x?? 。
第二步:构筑检验统计量。
在H0正确的基础上, z??2??2.32
n 第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。
查书后面的标准正态分布,得到z??1.96 第四步: 比较第二步和第三步的结果。
-2.32 < -1.96
=====> 我们无法接受原假设。
说明产品质量上出现了异常。
情况B 总体方差未知,但是样本很大。
3
例题:有位教育学家认为现在大学生的平均智能指数(I.Q.)最高为110。随机抽选150名大学生,测得他们平均智能指数为111.2,标准偏差为7.2。从这次抽样调查的结果,你如何评价那位教育学家的主张。
已知: 总体指标 ??110 ;
样本指标 x?111.2,SD?7.2 两侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。 H0:x?? ; H1:x?? 。
第二步:构筑检验统计量。
没有总体的期望和方差,本应该使用t分布,但样本数很大,所以还是使用正态分布。
x???2.04 在H0正确的基础上, z?SD 第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。
查书后面的标准正态分布,得到z??1.96 第四步: 比较第二步和第三步的结果。 2.04 〉 1.96
=====> 我们无法接受原假设。
那位教育学家的主张有些偏差。
9.3.2 根据t-分布进行平均值的检验
?2来替假设总体服从N?,?2。如果总体的方差?2是未知的,我们可以用???代?2。具体检验统计量为t?x????2。
n例题: 假设一种小汽车每行走12公里需要消耗1升汽油。抽选10辆小汽
车,测定的结果:平均每走11.8 公里需要耗油1升,每升油行走里程的标准偏差为0.3 公里。请分析一下。
条件:总体方差是已知的,或者虽然不知道总体方差,但是样本数很大。
??2x~N???,n???? ?已知: 总体指标 ??12km ;
样本指标 x?11.8km,SD?0.3km
4
两侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。 H0:x?? ; H1:x?? 。
第二步:构筑检验统计量。
x????2.108 在H0正确的基础上, t?SD 第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。 查书后面的t分布,得到t??10??1.96
2 第四步: 比较第二步和第三步的结果。 -2.108 < -1.96
=====> 我们无法接受原假设。
说明每升油可以走12公里这一说法不能接受。
单侧检验(two-tailed testing)方法 第一步:建立原假设和备择假设。 H0:x?? ; H1:x?? 。
第二步:构筑检验统计量。
x????2.108 在H0正确的基础上, t?SD 第三步:根据有意水准,查出临界值。
给出有意水准,例如??5%。这意味着允许犯错误的概率为5%。 查书后面的t分布,得到t??10???1.833
第四步: 比较第二步和第三步的结果。 -2.108 < -1.833
=====> 我们无法接受原假设。
说明每升油可以走12公里这一说法不能接受。
9.3.3 平均值差的检验
检验目的:两个母体间的平均值是否有差异。
2假设两个母体的期望和方差分别为:?1,?12;?2,?2 。
相应的样本的均值分别为:x1,x2;样本数分别为:n1,n2 。 如果两个样本间不相关,则有x1?x2~N?,?2,其中,???1??2,
????2?12n1?2?2n2??。如果?,?为未知的话,则有?21222?12?n1?2?2?n2 。
5