第8章 假设检验与方差分析
【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至83.12元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以28.45元报收后停牌。2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至20.16元。此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。有关数据如表8.1所示:
表8.1 乙肝新疫苗的应答率 统计人数(人) 应答人数(人) 安慰剂组 117 33 εPA-44 600μg组 120 36 εPA-44 900μg组 117 34 注:εPA-44为治疗用(合成肽)乙型肝炎疫苗简称。 应答率(%) 28.2 30.0 29.1 上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”?为什么说这个结论表示乙肝新疫苗无效?什么叫“在统计意义上无差异”?如何根据样本数据作出统计意义上有无差异的判断? 解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。这些分析研究都离不开假设检验或方差分析。假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。本教材介绍假设检验与方差分析的基本原理和一些基本方法。但通过本章的学习,理解了有关概念和基本思想,对更为复杂的检验结果也不难作出基本的判断和解读。
本章小结
1.假设检验是基于小概率原理的一种统计推断方法,针对待检验的原假设和备择假设,检验统计量及其分布是检验的理论基础,检验统计量的观测值及P值是作出检验结论的依据。检验结论可能犯的错误有两类,它们的概率α和β此消彼长。
2.参数的假设检验主要包括总体均值、总体方差和总体比例的检验。本章所介绍的检验
方法有Z检验、t检验、?检验、F检验等等。
3. 一个总体参数的假设检验和两个总体参数之差(或比)的检验,其检验统计量不同,要注意它们之间的联系与区别。
4.单因素方差分析法从形式上看是对多个总体均值相等性的一种F检验,实质上是研究一个定性变量对一个定量变量有无显著影响。基本概念主要有系统误差、随机误差、组内平方和、组间平方和、组内方差、组间方差等。方差分析法的基本思想是通过观察组间方差与组内方差之比(F统计量)是否显著偏大来判断有无系统误差的存在,从而检验多个总体均值是否相等。
5. 假设检验和方差分析的计算可借助于EXCEL或SPSS等软件来实现。
2基本知识梳理
基本知识点 原假设H0与备择假设H1 含义或公式 原假设或称零假设(记为H0)是有待根据样本信息来验证的、关于总体特征的某个命题;与之对立的假设称为备择假设(记为H1),意即预备在拒绝原假设时所选择的假设。 用于检验原假设是否成立的统计量,它反映样本的信息,检验统计量 不含未知总体参数但要包含待检验的参数假设值。检验统计量的概率分布是假设检验的理论依据。 假设检验的具体方法通常以检验统计量服从的分布来命检验法 名。如Z检验(正态检验)就是指检验统计量Z服从标准正态分布。常用的检验法还有t检验、F检验、χ2检验等。 小概率原理 发生概率很小的事件在一次试验中是不应该发生的。 事先对“小概率”所规定的一个标准,由研究者根据具体显著性水平α 情况确定,常常取0.05,也可取0.01, 0.10等。 第一类错误 原假设H0为真时误认为原假设不真,即拒绝了正确的原假(弃真) 设。犯第一类错误的概率为? (即显著性水平)。 第二类错误 原假设H0不真时误认为原假设为真,即未拒绝错误的原假(取伪) 设。犯第二类错误的概率用?表示。 P值 检验统计量等于检验统计值及更背离原假设情况的概率。(P-value) P值越小,拒绝原假设的信心越充足。 与一定显著性水平相对应的检验统计量取值区域,位于检拒绝域 验统计量分布的尾端。检验统计量的值落入该区域时,就应按检验规则拒绝原假设H0,反之则不能拒绝原假设。 临界值 原假设的拒绝区域和不能拒绝区域的分界点。 原假设的拒绝域在检验统计量分布曲线的双侧(双尾)。若双侧(双尾) 以θ表示待检验的总体参数,θ0表示假设值,双侧检验的检验 假设形式为H0:θ=θ0;H1:θ≠θ0。 拒绝域在检验统计量分布的单侧(单尾),又分左侧检验和单侧(单尾) 右侧检验。左侧检验的拒绝域在左侧,其假设形式为:H0:检验 θ=θ0(或θ≥θ0);H1:θ<θ0。右侧检验的拒绝域在右侧,其假设形式为:H0:θ=θ0(或θ≤θ0);H1:θ>θ0。 检验多个总体均值是否存在显著性差异(以鉴别所考察因方差分析 素对试验结果是否存在显著影响或效应)的统计推断方法。 水平(处理) 所考察因素在随机试验中的各种不同状态或不同类别。 总离差平方和(SST) SST???(yij?y)2,反映样本的全部观测值的差异。 i?1j?1kni总离差平方和=组内平方和+组间平方和 kni组内平方和SSE???(yij?yi)2,反映相同水平下样本观组内平方和i?1j?1(SSE)与组内测值之间由于随机波动而引起的差异,也称为误差平方和。 方差(MSE) SSE/(n-k)=MSE,称为组内方差。 SSE??ni(yi?y)2,反映不同水平下样本均值之间的差组间平方和i?1(SSA)与组间异,它既包含随机误差,也包含系统误差。 方差(MSA) SSA/(n-k)=MSA,称为组间方差。 k 检验方法一览表 待检验的总体参数 均 值 单个总体 成数 P=P0 大样本 或 Z?正态总体, 方差已知 均值 Z?原假设 前提条件 正态总体, 检验统计量 H0成立时检验统计量的分布 N(0,1) ???0 方差已知 正态总体, 方差未知 Z?X??0 ?/nt?X??0 S/nt(n-1) 2?(n?1) 方差 σ2=σ02 正态总体 ??Z?2(n?1)S2?20p?P0 P0(1?P0)/np?P0 p(1?p)/n n1?2?2N(0,1) (X1?X2)?D0?12N(0,1) n2?1??2=D0 正态总体,方差未知但相等 正态总体, 成对样本 t?两个总体 (X1?X2)?D0 112SW(?)n1n2t(n1+n2-2) t(n-1) F(n1-1,n2-1) t?d?D0Sd/n 方差 σ1=σ22 P1-P2 =D0 μi全相2正态总体 两个都是 大样本 随机项εij独立 S12F?2 S2Z?p1?p2?D0p1(1?p1)p2(1?p2)?n1n2成数 N(0,1) 多均值 εij ~N(0,σ2) F?SSA/(k?1)MSA? SSE/(n?k)MSEF(k-1,n-k)