实用标准
协方差分析的基本原理
1.协方差分析的提出
无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。
例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。一般情况下,工作年限越长,工资就越高。在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。再如,如果要了解接受不同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysis of Covariance),通过统计模型的校正使得各组在“进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。
为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。利用协方差分析就可以完成这样的功能。协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。
协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。
2.协方差分析的计算公式
以单因素协方差分析为例,总的变异平方和表示为:
Q总=Q控制变量?Q协变量?Q随机变量
协方差分析仍然采用F检验,其零假设H0为多个控制变量的不同水平下,各总体平均值没有显著差异。F统计量计算公式为:F控制变量=S2控制变量S2随机变量S2协变量,F协变量=2
S随机变量以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。
如果F控制变量的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如果F协变量的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。 3.协方差分析需要满足的假设条件
(1)自变量是分类变量,协变量是定距变量,因变量是连续变量; (2)对连续变量或定居变量的协变量的测量不能有误差;
(3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设; (4)协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。
文案大全
实用标准
(5)自变量与协变量是直角关系,即互不相关,它们之间没有交互作用。如果协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除。
4.协方差分析SPSS的示例
在进行新的外语教学方法实验时,往往需要在实验前和实验后对实验组和控制组的学生都进行成绩测试,以便确定新的教学方法对实验后成绩的影响。显然,实验前成绩与实验后成绩之间会有内在联系,如果要更准确地确定新的教学方法的效果,有必要考虑实验前成绩对实验后成绩的影响,也就是说可以把前测成绩作为协变量进行协方差分析。
本例子中的实验研究共有15名受试者,将这些受试者随机分为3组,各组有5人,然后对这三组进行不同的教学方法实验。其中一组为控制组,实验时不对教学方法进行改变,仍然采用以前的传统教学方法。另两组为实验组,分别用交际法和沉浸法两种教学方法进行教学方法实验。实验开始前对这三组学生用相同的试卷进行了英语测试,得出了前测成绩。实验结束后,用新的试卷同时对这三组学生进行了测试,得出了后测成绩。然后将要分析的数据输入到SPSS中去。见数据录入表格所示。我们用1表示传统教学方法,2表示交际法,3表示沉浸法。
我们先不考虑前测成绩,以“教学方法”为因素变量,“后测成绩”为因变量进行单因素方差分析。从方差分析结果来看,概率值为0.463(远远大于0.05的显著性水平),说明三种教学方法在后测成绩上似乎没有显著差异,但如果以前测成绩作为协变量进行方差分析时,分析结果可能就会有差异。以下将以前测成绩作为协变量进行方差分析,检验三种不同教学方法是否真的没有显著差异。
未作协方差分析之前的单因素方差分析表
ANOVA
后测成绩
Between Groups Within Groups Total
Sum of Squares 213.333 1560.000 1773.333 df 2 12 14 Mean Square 106.667 130.000 F .821 Sig. .463 用SPSS进行协方差分析,可以分两大步骤进行,首先检验回归斜率相等的假设,然后进行协方差分析。 一、回归斜率相等的假设 1、分组散点图
对于本例,首先应了解三种教学方法的前测成绩与后测成绩的回归线是否平行,即前测考试成绩的影响在分别采用三种教学法的三个班级中是否相同,这可以用前测成绩与教学法是否存在交互作用来表示。对于该问题,首先可以作分组散点图,观察三组直线趋势是否近似,然后看交互作用有无统计学意义,当交互作用无统计学意义时,则进行协方差分析,得出统计结论。
在菜单中选择Graphs→Scatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为(Panel by →Rows),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单Element→Fit Line at Total,可以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。
文案大全
实用标准
如果按照菜单Graphs→Scatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为标记变量(Set markers by),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单Element→Fit Line at Total,可以得到如下图所示的散点图,作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单Element→Fit Line at subgroups,可以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。
2、组内回归斜率相同检验
步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。
步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。
步骤3:确定分析模型。在对话框中单击Model命令按钮,进入Univariate Model对话框中。该对话框提供了两种不同形式的模型,完全因素(full factorial)和自定义因素(custom)模型。由于要进行回归斜率相同的检验,所以本例使用自定义因素模型。点击Custom选择按钮后,从左边的变量列表中选择“教学方法”,点击右向箭头将其移入Model方框中。用同样的方法将变量列表中的“前测成绩”移入Model方框中。最后在变量列表中连续点击“教学方法”和“前测成绩”,同时选中它们,再点击右向箭头,Model方框中会出现“教学方法*前测成绩”字样,意为进行交互效应分析,即检验回归线斜率相等的假设。点击
文案大全
实用标准
Continue命令按钮回到主对话框中,并点击OK按钮提交程序运行。
组内回归斜率相同检验结果 Tests of Between-Subjects Effects
Dependent Variable:后测成绩
Source Corrected Model Intercept 教学方法 前测成绩 教学方法*前测成绩 Error Total Corrected Total Type III Sum of Squares 1498.531(a) 632.390 84.312 86.072 166.488 274.802 47700.000 1773.333 df 5 1 2 1 2 9 15 14 Mean Square 299.706 632.390 42.156 86.072 83.244 30.534 F 9.816 20.711 1.381 2.819 2.726 Sig. .002 .001 .300 .127 .119 a R Squared = .845 (Adjusted R Squared = .759)
上表是组内回归斜率相同检验结果,教学方法与前测成绩的交互效应检验的F值为2.726,概率值为0.119(大于0.05),没有达到显著性水平,表明三组的回归斜率相同,即各组的回归线为平行线,符合了协方差分析的回归斜率相同的条件。这一结果表明,下面所进行的协方差分析的结果是有效的。 二、协方差分析步骤
步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。
步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。
步骤3:选择组建对比方式和输出结果。由于有了协方差,无法使用主对话框中Post Hoc命令按钮进行组间多重比较。但是可以按照下面的方法进行。在主对话框中点击Option按钮,进入结果输出选择对话框中,从左边的因素变量列表中选择“教学方法”将其移入Display Means for方框中,意为输出不同教学方法后测成绩调整后(考虑了协变量效应之后)的边缘平均值。选择Compare main effects,意为对“教学方法”各组的后测成绩平均值进行组间比较。在Confidence interval adjustment 下拉菜单中选择LSD,意
文案大全
实用标准
为进行Tukey LSD事后检验。
选择输出结果时,在Display部分选择Descriptive statistics、Homogeneity tests,分别意味着输出每一组的描述统计量和方差齐性检验(见下图)
步骤4:指定模型形式。在主对话框中点击Model按钮进入Univariate:Model对话框。本例采用完全因素模型,即点击Full factorial按钮(见下图)。完全因素模型包括全部因素变量和协变量的主效应、因素变量间的交互效应,但不包括与协变量的交互效应。由于本例中只有一个因素变量和一个协变量,没有交互效应,计算结果只会有主效应。至此为止,所有对话框指定完毕,点击Continue按钮回到主对话框,再点击OK按钮提交程序运行即可。
文案大全