22. 方差分析
一、方差分析原理
1. 方差分析概述
方差分析可用来研究多个分组的均值有无差异,其中分组是按影响因素的不同水平值组合进行划分的。
方差分析是对总变异进行分析。看总变异是由哪些部分组成的,这些部分间的关系如何。
方差分析,是用来检验两个或两个以上均值间差别显著性(影响观察结果的因素:原因变量(列变量)的个数大于2,或分组变量(行变量)的个数大于1)。一元时常用F检验(也称一元方差分析),多元时用多元方差分析(最常用Wilks’∧检验)。
方差分析可用于:
(1)完全随机设计(单因素)、随机区组设计(双因素)、析因设计、拉丁方设计和正交设计等资料;
(2)可对两因素间交互作用差异进行显著性检验; (3)进行方差齐性检验。
要比较几组均值时,理论上抽得的几个样本,都假定来自正态总体,且有一个相同的方差,仅仅均值可以不相同。还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。所谓的方差是离均差平方和除以自由度,在方差分析中常简称为均方(Mean Square)。
.
2. 基本思想
基本思想是,将所有测量值上的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。
根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分成相应的各个部分,各部分的离均差平方除以各自的自由度得出各部分的均方,然后列出方差分析表算出F检验值,作出统计推断。
方差分析的关键是总离均差平方和的分解,分解越细致,各部分的含义就越明确,对各种效应的作用就越了解,统计推断就越准确。
效应项与试验设计或统计分析的目的有关,一般有:主效应(包
括各种因素),交互影响项(因素间的多级交互影响),协变量(来自回归的变异项),等等。
当分析和确定了各个效应项S后,根据原始观察资料可计算出各个离均差平方和SS,再根据相应的自由度df,由公式MS=SS/df,求出均方MS,最后由相应的均方,求出各个变异项的F值,F值实际上是两个均方之比值,通常情况下,分母的均方是误差项的均方。
.
2
.
根据F值的分子、分母均方的自由度f1和f2,在确定显著性水平为α情况下,由F(f1, f2)临界值表查得单侧Fα界限值。当F
3.方差分析的实验设计
为了确定方差分析表中各个有关效应项,需要在试验设计阶段就作出安排,再根据设计要求进行试验,得出原始观察值,按原来设计方案算出方差分析表中的各项。
在试验设计阶段通常需要考虑如下4个方面: (1)研究的主要变量(因变量)
即试验所要观察的主要指标,一次试验时可以有多个观察指标,方差分析时也可以同时对多个因变量进行分析;
(2)因素和水平
试验的因素(factor)可以是品种、人员、方法、时间、地区等等,因素所处的状态叫水平(level)。在每一个因素下面可以分成若干水平。
例如,某工厂的原料来自4个不同地区,那么用不同地区的原料生产的产品质量是否一致呢?所要比较的地区就是因素,4个地区便是地区这一因素的4个水平。当某个主要因素的各个水平间的主要因
.
3
.
变量的均值呈现统计显著性时,必要时可作两两水平间的比较,称为均值间的两两比较。
(3)因素间的交互影响
多因素的试验设计,有时需要分析因素间的交互影响(interaction),2个因素间的交互影响称为一级交互影响(A×B);3个因素间的交互影响称为二级交互影响(A×B×C)。
当交互影响项呈现统计不显著时,表明各个因素独立,当呈现统计显著时,就需要列出这个交互影响项的效应,以助于作出正确的统计推断。
二、单因素方差分析
1个因变量,1个影响因素:
总差异Yij = 平均差异μ + 因素差异αi + 随机差异εij 例1 比较4种品牌的胶合板的耐磨性,各抽取5个样品,相同转速磨损相同时间测得磨损深度(mm),如下:
.
4
.
比较4个品牌胶合板的耐磨性有无差异?
总差异Yij = 平均磨损μ + 品牌差异αi + 随机差异εij
1. 【分析】——【一般线性模型】——【单变量】,打开“单变量”窗口,将变量“wear磨损深度”选入【因变量】框,“brand品牌”选入【固定因子】框;
2. 点【两两比较】,打开“观测均值的两两比较”子窗口,勾选【假定方差齐性】下的“LSD”、“S-N-K”,点【继续】;
. 5