易读文库
协方差分析
第一节协方差分析的意义
协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分述如下。
一、对试验进行统计控制
为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研究发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。这时可利用仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更为准确。若y的变异主要由x的不同造成(处理没有显著效应),则各矫正后的y?间将没有显著差异(但原y间的差异可能是显著的)。若y的变异除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各y?间将有显著差异(但原y间差异可能是不显著的)。此外,矫正后的y?和原y的大小次序也常不一致。所以,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysis of covariance)。
二、估计协方差组分
在第八章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:
r??(x?x)(y?y)?(x?x)2?(y?y)2
若将公式右端的分子分母同除以自由度(n-1),得
r??(x?x)(y?y)/(n?1)??(x?x)???(y?y)???22 (10-1)
?其中
(n?1)???(n?1)???(x?x)2n?12是x的均方MSx,它是x的方差?x的无偏估计量;
易读文库
n?1?(x?x)(y?y)n?1?(y?y)2是y的均方MSy,它是y的方差?2的无偏估计量;
y称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即
MPxy=
?(x?x)(y?y)=
n?1?xy?(?x)(?y)nn?1 (10-2)
与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或?xy。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy= COV(x,y)。
于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:
MPxy (10-3) r?MSxMSy相应的总体相关系数?可用x与y的总体标准差?x、?y,总体协方差COV(x,y)或?xy表示如下:
??COV(x,y)??xy?x?y?x?y (10-4)
均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。
在随机模型的方差分析中,根据均方MS和期望均方EMS的关系,可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积MP和期望均积EMP的关系,可得到不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。
由于篇幅限制,本章只介绍对试验进行统控制的协方差分析。
第二节单因素试验资料的协方差分析
设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表10—1所示。
表10—1 kn对观测值x、y的单向分组资料的一般形式 处 理 观测指标 观测值 xij、yij (i=1,2,…k j=1,2,…n) 总和 平均数 处理1 x y x11 y11 x12 y12 … … x1j y1j … … x1n y1n x1. y1. x1. y1. 处理2 x y x21 y21 x22 y22 … … x2j y2j … … x2n y2n x2. y2. x2. y2. … … … … … … … … … … 处理i x y xi1 yi1 xi2 yi2 … … xij yij … … xin yin xi. yi. xi. yi. … … … … … … … … … 处理k x y xk1 yk1 xk2 yk2 … … xkj ykj … … xkn ykn xk. yk. xk. yk. 易读文库
表10—1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为:
总变异的乘积和SPT是xij与x..和yij与y..的离均差乘积之和,即:
SPT???(xij?x..)(yij?y..)???xijyij?i?1j?1i?1j?1knknx..y.. (10-5) kndfT=kn-1
其中,x..??xi.,y..??yi.,x..?x..kn,y..?y..kn 。
i?1i?1kk处理间的乘积和SPt是xi.与x..和yi.与y..的离均差乘积之和乘以n,即:
x.y.1kSPt?n?(xi.?x..)(yi.?y..)??xi.yi.?ii(10-6)
ni?1kni?1kdft?k?1
处理内的乘积和SPe是xij与xi.和yij与yi.的离均差乘积之和,即:
1kSPe???(xij?xi.)(yij?yi.)???xijyij??xi.yi.?SPT?SPt(10-7)
ni?1j?1i?1j?1i?1knkndfe=k(n-1)
以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、…、nk,其和为
?ni?1ki,则各项乘积和与自由度的计算公式为:
kniSPT???xijyij?i?1j?1xi.yi.i?1k?nk
idfT=?ni-1 (10-8)
i?1SPt?x.y.x..y..x1.y1.x2.y2. ??...?kk?kn1n2nk?nii?1dft?k?1
?x.y.x.y.x.y.?SPe???xijyij-?11?22?...?kk?=SPT-SPt
n2nk??n1i?1j?1knidfe=?ni-k =dfT-dft (10-9)
i?1k有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。
【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10—2,试作分析。
此例,x..?x1.?x2.?x3.?x4. =18.25+15.40+15.65+13.85=63.15
y..?y1.?y2.?y3.?y4.=141.80+130.10+144.80+133.80=550.50
易读文库
k=4,n=12,kn=4×12=48
表10—2 不同食欲增进剂仔猪生长情况表(单位:kg) 处 理 观测 指标 x 对照 初生重 50日 龄重y x 配方1 初生重 50日 龄重y x 配方2 初生重 50日 龄重y 初生重x 配方3 50日 龄重y 1.50 12.40 1.85 12.00 1.35 10.80 1.45 10.00 1.40 11.00 观察值 1.45 11.80 1.50 12.50 1.55 13.40 1.40 11.20 1.50 11.60 1.60 12.60 1.70 12.50 总和xi.,yi. 平均xi.,yi. 18.25 141.80 1.52 11.82 1.35 10.20 1.20 9.40 1.45 12.20 1.20 10.30 1.40 11.30 1.30 11.40 1.15 12.80 1.30 10.90 1.35 11.60 1.15 8.50 1.35 12.20 1.20 9.30 15.40 130.80 1.28 10.84 1.15 10.00 1.10 10.60 1.10 10.40 1.05 9.20 1.40 13.00 1.45 13.50 1.30 13.00 1.70 14.80 1.40 12.30 1.45 13.20 1.25 12.00 1.30 12.80 15.65 144.80 1.30 12.07 1.20 12.40 1.00 9.80 1.15 11.60 1.10 10.60 1.00 9.20 1.45 13.90 1.35 12.80 1.15 9.30 1.10 9.60 1.20 12.40 1.05 11.20 1.10 11.00 13.85 133.80 1.15 1.15 xij,yij 协方差分析的计算步骤如下:
(一)求x变量的各项平方和与自由度 1、总平方和及自由度
SST(x)???2xijx..263.15263.152222??(1.50?1.85?...?1.10)??84.8325??1.75 kn4848dfT(x)=kn-1=4×12-1=47 2、处理间平方和与自由度
1k2x..2163.1522222SSt(x)??xi.??(18.25?15.40?15.65?13.85)??0.83dft(x)=k
ni?1kn1248-1=4-1=3
3、处理内平方和与自由度
SSe(x)=SST(x)-SSt(x)=1.75-0.83=0.92
dfe(x)=dfT(x)-dft(x)=47-3=44
(二)求y变量各项平方和与自由度 1、总平方和与自由度
SST(y)???2yij2y..550.52550.52222??(12.40?12.00?...?11.00)??6410.31??96.76 kn4848dfT(y)=kn-1=4×12-1=47 2、处理间平方和与自由度
2y..11550.50222222SSt(y)?yi.??(141.80?130.80?144.80?133.80)??11.68
nkn1248dft(y)=k-1=4-1=3
?易读文库
3、处理内平方和与自由度
SSe(y)=SST(y)-SSt(y)=96.76-11.68=85.08
dfe(y)=dfT(y)-dft(y)=47-3=44
(三)求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度
knx..y.. SP?xy???Tijijkni?1j?1?1.50?12.40?1.85?12.00?...?1.10?11.00?63.15?550.50?8.254?12dfT(x,y)=kn-1=4×12-1=47
?732.50?63.15?550.504?12
2、处理间乘积和与自由度
1kx..y..SP?x.y.??iikn tni?1?163.15?550.50 (18.25?141.80?15.40?130.10?15.65?144.80?13.85?133.80)?124?12=1.64
dft(x,y)=k-1=4-1=3
3、处理内乘积和与自由度 SPe=SPT-SPt=8.25-1.64=6.61 dfe(x,y)=dfT(x,y)-dft(x,y)=47-3=44
平方和、乘积和与自由度的计算结果列于表10—3。
表10—3 x与y的平方和与乘积和表
变异来源 处理间(t) 处理内(误差)(e) 总变异(T) df 3 44 47
SSx
0.83 0.92 1.75
SSy
11.68 85.08 96.76
SPxy
1.64 6.61 8.25
(四)对x和y各作方差分析(表10—4)
表10—4 初生重与50日龄重的方差分析表 变异来源 处理间 处理内(误差) 总变异 分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50 日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。
df 3 44 47 SS 0.83 0.92 1.75 x变量 MS F 0.28 13.33** 0.021 y变量 SS MS 11.68 3.89 85.08 1.93 96.76 F值 F 2.02 F0.05=2.82 F0.01=4.26 (五)协方差分析