好文档 - 专业文书写作范文服务资料分享网站

方差分析

天下 分享 时间: 加入收藏 我要投稿 点赞

A1 A2 A3 A4 31.9 24.8 22.1 27.0 27.9 25.7 23.6 30.8 31.8 26.8 27.3 29.0 28.4 27.9 24.9 24.5 35.9 26.2 25.8 28.5

合计 这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:

2/nk?550.82/(4?5)?15169.03 矫正数 C?x..2?C?31.92?27.92???28.52?C 总平方和 SST???xijl155.9 31.18

131.4 26.28 123.7 24.74 139.8 27.96 x..=550.8

?15368.7?15169.03?199.67

处理间平方和 SSt?11xi.2?C?(155.92?131.42?123.72?139.82)?C n5?15283.3?15169.03?114.27?处理内平方和 SSe?SST?SSt?199.67?114.27?85.40 总自由度 dfT?nk?1?5?4?1?19 处理间自由度 dft?k?1?4?1?3 处理内自由度 dfe?dfT?dft?19?3?16

用SSt、SSe分别除以dft和dfe便得到处理间均方MSt及处理内均方MSe。

MSt?SSt/dft?114.27/3?38.09

MSe?SSe/dfe?85.40/16?5.34因为方差分析中不涉及总均方的数值,所以不必计算之。

三、期望均方

如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即

22?12??2????k??2,?i2(i=1,2,…,k)表示第i个处理观测值总体的方差。如果所分析的

资料满足这个方差同质性的要求,那么各处理的样本方差S1,S2,…,Sk都是σ的无偏估计(unbiased estimate)量。Si2 (i=1,2,…,k)是由试验资料中第i个处理的n个观测值算得的方差。

显然,各Si2的合并方差Se2(以各处理内的自由度n-1为权的加权平均数)也是σ的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各Si2的合并。

SSMSe?e?dfe2

2222

??(xij?xi.)2k(n?1)??SSik(n?1)?SS1?SS2???SSkdf1?df2???dfk2df1S12?df2S2???dfkSk2??Se2?估计????2df1?df2???dfk

其中SSi、dfi(i=1,2,…,k)分别表示由试验资料中第i个 处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差σ的无偏估计量。

试验中各处理所属总体的本质差异体现在处理效应?i的差异上。我们把

2

?a2i/(k?1)??(?i??)2/(k?1)称为效应方差,它也反映了各处理观测值总体平均数?i的

2变异程度,记为??。

2?a??i2 (6-13) ?k?12因为各?i未知,所以无法求得??的确切值,只能通过试验结果中各处理均数的差异去2估计。然而,?(xi.?x..)2/(k?1)并非??的无偏估计量。这是因为处理观测值的均数间的差

异实际上包含了两方面的内容:一是各处理本质上的差异即αi(或μi)间的差异,二是本

2身的抽样误差。统计学上已经证明,?(xi.?x..)2/(k?1)是??+σ/n的无偏估计量。因而,

2

2

2我们前面所计算的处理间均方MSt实际上是n??+σ的无偏估计量。

2 因为MSe是σ的无偏估计量,MSt是n??+σ的无偏估计量,所以σ为MSe的数学2期望(mathematical expectation),n??+σ为MSt的数学期望。又因为它们是均方的期望

2

222

值(expected value),故又称期望均方,简记为EMS(expected mean squares)。

2 当处理效应的方差??=0,亦即各处理观测值总体平均数?i(i=1,2,…,k)相等时,处

2

理间均方MSt与处理内均方一样,也是误差方差σ的估计值,方差分析就是通过MSt 与

2MSe的比较来推断??是否为零即?i是否相等的。

四、F分布与F检验

(一)F分布 设想我们作这样的抽样试验,即在一正态总体N(μ,σ2)中随机

抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的St和Se都是误差方差?22222的估计量。以Se为分母,St为分子,求其比值。统计学上把两个均方之比值称为F值。即

F?St2/Se2 (6-14)

F具有两个自由度:df1?dft?k?1,df2?dfe?k(n?1)。

若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布(F distribution)。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图6-1所示。

图6-1 F分布密度曲线 F分布的取值范围是(0,+∞),其平均值?F=1。

用f(F)表示F分布的概率密度函数,则其分布函数F(F?)为:

F(F?)?P(F?F?)???F?f(F)dF (6-15)

因而F分布右尾从F?到+∞的概率为:

P(F?F?)?1?F(F?)??F???f(F)dF (6-16)

附表4列出的是不同df1和df2下,P(F≥F?)=0.05和P(F≥F?)=0.01时的F值,即右尾概率α=0.05和α=0.01时的临界F值,一般记作F0.05(df1,df2),F0.01(df1,df2)。如查附表4,当df1=3,df2=18时,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以df1=dft=3,df2=dfe=18在同一正态总体中连续抽样,则所得F值大于3.16的仅为5%,而大于5.09的仅为1%。

(二)F检验 附表4是专门为检验St2代表的总体方差是否比Se2代表的总体方差大而

设计的。若实际计算的F值大于F0.05(df1,df2),则F值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断St2代表的总体方差大于Se2代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。

在方差分析中所进行的F检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算F值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。

在单因素试验结果的方差分析中,无效假设为H0:μ1=μ2=…=μk,备择假设为HA:各

22μi不全相等,或H0 :?? =0,HA: ??≠0;F=MSt/MSe,也就是要判断处理间均方是否显

著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。反过来理解:如果H0是正确的,那么MSt与MSe都是总体误差σ的估计值,理论上讲F值等于1;

2如果H0是不正确的,那么MSt之期望均方中的??就不等于零,理论上讲F值就必大于1。

2

但是由于抽样的原因,即使H0正确,F值也会出现大于1的情况。所以,只有F值大于1达到一定程度时,才有理由否定H0。

实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值F0.05(df1,df2),

F0.01(df1,df2)相比较作出统计推断的。

若F<F0.05(df1,df2),即P>0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;若F0.05(df1,df2)≤F<F0.01(df1,df2),即0.01<P≤0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F≥F0.01(df1,df2),即P≤0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“**”。

对于【例6.1】,因为F=MSt/MSe=38.09/5.34=7.13;根据df1=dft=3,df2=dfe=16查附表

**

4,得F>F0.01(3,16) =5.29,P<0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。

在方差分析中,通常将变异来源、平方和、自由度、均方和F值归纳成一张方差分析表,见表6-3。

表6-3 表6-2资料方差分析表

变异来源 平方和 自由度 均方 F值 处理间 114.27 3 38.09 7.13** 处理内 85.40 16 5.34 总变异 199.67 19 表中的F值应与相应的被检验因素齐行。因为经F检验差异极显著,故在F值7.13右上方标记“**”。

在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F值检验可在方差分析表上进行。

五、多重比较

F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。

多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。

(一)最小显著差数法 (LSD法,least significant difference) 此法的基本作法是:

在F检验显著的前提下,先计算出显著水平为α的最小显著差数LSD?,然后将任意两个处理平均数的差数的绝对值xi.?xj.与其比较。若xi.?xj.>LSDa时,则xi.与xj.在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由(6-17)式计算。

LSDa?ta(dfe)Sxi.?xj. (6-17)

式中:t?(dfe)为在F检验中误差自由度下,显著水平为α的临界t值,Sxi.?xj.为均数差异标准误,由(6-18)式算得。

Sxi.?xj.?2MSe/n (6-18)

其中MSe为F检验中的误差均方,n为各处理的重复数。

当显著水平α=0.05和0.01时,从t值表中查出t0.05(dfe)和t0.01(dfe),代入(6-17)式得:

LSD0.05?t0.05(dfe)Sxi.?xj. (6-19)

LSD0.01?t0.01(dfe)Sxi.?xj.利用LSD法进行多重比较时,可按如下步骤进行:

(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列; (2)计算最小显著差数LSD0.05和LSD0.01;

(3)将平均数多重比较表中两两平均数的差数与LSD0.05、LSD0.01比较,作出统计推断。 对于【例6.1】,各处理的多重比较如表6-4所示。

表6-4 四种饲料平均增重的多重比较表(LSD法) 处理 A1 A4 A2 A3

平均数xi. 31.18 27.96 26.28 24.74

xi.-24.74

xi.-26.28

xi.-27.96

6.44** 3.22* 1.54ns 4.90** 1.68 ns 3.22*

注:表中A4与 A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。

因为,Sxi.?xj.?2MSe/n?2?5.34/5?1.462;查t值表得:t0.05(dfe) =t0.05(16) =2.120, t0.01(dfe)=t0.01(16)=2.921

所以,显著水平为0.05与0.01的最小显著差数为

LSD0.05?t0.05(dfe)Sxi.?xj.?2.120?1.462?3.099

LSD0.01?t0.01(dfe)Sxi.?xj.?2.921?1.462?4.271将表6-4中的6个差数与LSD0.05,LSD0.01比较:小于LSD0.05者不显著,在差数的右上方标记“ns”,或不标记符号;介于LSD0.05与LSD0.01之间者显著,在差数的右上方标记“*”;大于LSD0.01者极显著,在差数的右上方标记“**”。检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4 与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。

关于LSD法的应用有以下几点说明:

1、LSD法实质上就是t检验法。它是将t检验中由所求得的t之绝对值

(t?(xi.?xj.)/Sxi.?xj.)与临界ta值的比较转为将各对均数差值的绝对值xi.?xj.与最小显著

差数taSxi.?xj.的比较而作出统计推断的。但是,由于LSD法是利用F检验中的误差自由度dfe查临界ta值,利用误差均方MSe计算均数差异标准误Sxi.?xj.,因而LSD法又不同于每次利用两组数据进行多个平均数两两比较的t检验法。它解决了本章开头指出的t检验法检验过程烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但LSD法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。

2、有人提出,与检验任何两个均数间的差异相比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更

适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。

3、因为LSD法实质上是t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只

方差分析

A1A2A3A431.924.822.127.027.925.723.630.831.826.827.329.028.427.924.924.535.926.225.828.5合计这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下:2/nk?550.82/(4?5)?15169
推荐度:
点击下载文档文档为doc格式
3frq2058i49o8y29wt5t6vudb8bhn000zaf
领取福利

微信扫码领取福利

微信扫码分享