word格式
23. 协方差分析
(一)原理 一、基本思想
在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。
协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。
协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。
当有一个协变量时,称为一元协方差分析,当有两个或两个以
.. ..
word格式
上的协变量时,称为多元协方差分析。
二、协方差分析需要满足的条件
(1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差;
(2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设;
(3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除;
(4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论
1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即
yij?u?ti??(xij?x)??ij (1)
其中,X为所有协变量的平均值。
注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。
用协变量进行修正,得到修正后的yij(adj)为
yij(adj)?yij??(xij?x)?u?ti??ij
.. ..
word格式
就可以对yij(adj)做方差分析了。关键问题是求出回归系数β.
2. 总离差=分组变量离差+协变量离差+随机误差, (1)计算总离差平方和时,记
Txy???(xij?x)(yij?y)
i?1j?1kknTxx???(xij?x)2
i?1j?1kn总离差平方和:Tyy???(yij?y)2
i?1j?1n最终要检验分组自变量对因变量有无显著作用。原假设H0:无显著作用。假设检验是在H0为真条件下进行,可认为ti=0,则
yij?u??T(xij?x)??ij
按最小二乘法原理线性回归可得到β的估计值
Txy? ?T?Txx记修正的总离差平方和(残差平方和)为Tyy(adj),则
?T2T?T?Tyy(adj)?Tyy??xxyy2TxyTxx,自由度为n-2
??0(回归线为水平线),表示?T2T为回归平方和,若?注:?xxT协变量x对y无作用,用方差分析就可以解决了。
(2)计算组内离差平方和时,记
Exy???(xij?xi)(yij?yi)
i?1j?1kknExx???(xij?xi)2
i?1j?1n.. ..
word格式
组内总离差平方和:Eyy???(yij?yi)2
i?1j?1kn根据协方差分析的基本假设:各组内回归系数相等(做协方差分析时需要检验这一点),得到组内回归系数βw的估计值
???wExyExx
记修正的组内总离差平方和(组内残差平方和)为Eyy(adj), 则
?2E?E?Eyy(adj)?Eyy??wxxyy2ExyExx, 自由度为n-k-1
?2E为组内回归平方和,当???其中,?wxxw1?时,组内总离差平??wk方和认为完全是由随机因素引起的,Eyy(adj)就是随机为误差。这里的
?是??,,??的加权平均值。 ?ww1wk(3)计算分组变量离差平方和Byy(adj),它反映的是各个水平之间的差异。
?T2T?EByy(adj)?Tyy(adj)?Eyy(adj)?Tyy??xxyy(adj)
即,分组变量离差=总离差-协变量离差-随机误差。
于是,就可以进行组间无差异检验了:
F?Byy(adj)/k?1Eyy(adj)/n?k?1
3. 因此,在做协方差分析前,需要依次做两个假设检验: (1)协变量对因变量的影响对与各组来说都是相同的,即各组
??回归系数相等:?w1步骤:
?:???; ??wkw① 先按回归系数相等和不相等分别表示模型
.. ..
word格式
yij?u?ti??w(xij?x)??ij yij?u?ti??wi(xij?x)??ij
并计算出误差平方和
2Eyy(adj)?Eyy??wExx
2S1?Eyy???wiExxi
i?1kk其中,Eyy??Eyyi.
i?1② 计算F值
F?Eyy(adj)?S1/k?1S1/n?2k
若F值小于临界值Fα,则说明各组回归系数无显著差异(相等)。
??0. (2)这些相等的回归系数?w即采用一元线性回归的显著性检验,
2?wExx/1回归平方和/自由度F?=
残差平方和/自由度Eyy(adj)/(n?k?1)?2Exy/Exx(Eyy?E/Exx)/(n?k?1)2xy?2Exy(n?k?1)EyyExx?E2xy
4. 协方差分析的步骤
(1)检验数据是否满足假设条件:正态分布性、方差齐性、线性相关性、平行性;
(2)检验效应因子的显著性; (3)估计校正的组均值;
(4)检验校正的组均值之间的差异。
.. ..