多因素方差分析
定义:
多因素方差分析中的控制变量在两个或两个以上,研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。
前提:
1总体正态分布。当有证据表明总体分布不是正态分布时,可以将数据做正态转化。 2变异的相互独立性。
3各实验处理内的方差要一致。进行方差分析时,各实验组内部的方差批次无显著差异,这是最重要的一个假定,为满足这个假定,在做方差分析前要对各组内方差作齐性检验。
多因素方差分析的三种情况:
只考虑主效应,不考虑交互效应及协变量; 考虑主效应和交互效应,但不考虑协变量; 考虑主效应、交互效应和协变量。
一、多因素方差分析 1选择分析方法
本题要判断控制变量“组别”和“性别”是否对观察变量“数学”有显著性影响,而控制变量只有两个,即“组别”、“性别”,所以本题采用双因素分析法,但需要进行正态检验和方差齐性检验。
2建立数据文件
在SPSS17.0中建立数据文件,定义4个变量:“人名”、“数学”、“组别”、 “性别”。控制变量为“组别”、 “性别”,观察变量为“数学”。在数据视图输入数据,得到如下数据文件:
3正态检验(P>0.05,服从正态分布) 正态检验操作过程:
“分析”→“描述统计”→“探索”,出现“探索”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别”、“性别”放入“因子列表”,将“人名”放入“标注个案”; 点击“绘制”,出现“探索:图”窗口,选中“直方图”和“带检验的正态图”,点击“继续”; 点击“探索”窗口的“确定”,输出结果。
因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分组变量。标注个案是区分每个观测量的变量。
带检验的正态图(Normality plots with test,复选框):选择此项,将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。
表1 控制变量为“组别”的正态性检验 成绩 组别 1 2 3 Kolmogorov-Smirnov 统计量 .116 .145 .147 df 10 10 10 Sig. .200 .200 .200 ***aShapiro-Wilk 统计量 .969 .961 .918 df 10 10 10 Sig. .884 .793 .343 a. Lilliefors 显著水平修正 *. 这是真实显著水平的下限。 表2 控制变量为“性别”的正态性检验 成绩 性别 0 1 Kolmogorov-Smirnov 统计量 .174 .186 df 15 15 Sig. .200 .170 *aShapiro-Wilk 统计量 .916 .953 df 15 15 Sig. .165 .575 a. Lilliefors 显著水平修正 *. 这是真实显著水平的下限。 正态检验结果分析:
表1 控制变量为“组别”的正态性检验结果,Shapiro-Wilk 的p值0.884、0.793、0.343都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布。
表2 控制变量为“性别”的正态性检验结果,Shapiro-Wilk 的p值0.165、0. .575都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布。
情况一 只考虑主效应:(包括4、5步)(区别用下划线)
4多因素方差分析操作过程
“分析”→ “一般线性模型”→“单变量”,出现“单变量”窗口,将因变量“成绩”放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模型”,出现“单变量:模型”窗口,点击“设定”,在“构建项”选择“主效应”,将“组别”和“性别”分别放入“模型”列表,点击“继续”,回到主对话框;点击“绘制”,出现“单变量:轮廓图”,将“组别”放入“水平轴”,将“性别”放入“单图”,点击“添加”,点击“继续”,回到主对话框;点击“两两比较”,将“组别”和“性别”放入“两两比较检验”列表,选择“LSD”和“S-N-K” 、“Dunnett’s C”,点击“继续”,回到主对话框;点击“选项”选择“方差同质性检验”和“描述性”,点击“继续”,回到主对话框;点击“单变量”窗口的“确定”,输出结果。
5多因素方差分析结果分析
表1 主体间因子
组别
1 2 3
N
10 10 10 15 15 性别 0 1
表2 描述性统计量 因变量:成绩 组别 1 性别 0 1 总计 2 0 1 总计 3 0 1 总计 总计 0 1 总计 均值 91.17 87.25 89.60 80.00 83.60 81.80 62.00 70.83 67.30 79.67 79.47 79.57 标准 偏差 7.468 4.992 6.586 11.958 8.204 9.852 7.616 10.028 9.799 14.802 10.763 12.716 N 6 4 10 5 5 10 4 6 10 15 15 30 表3 误差方差等同性的 Levene 检验 因变量:成绩 F .710 df1 5 df2 24 Sig. .622 a检验零假设,即在所有组中因变量的误差方差均相等。 a. 设计 : 截距 + 组别 + 性别 表2 描述性统计,组1数学成绩取值范围:平均值±标准差, 表3误差方差等同性的 Levene 检验,P=0. 622>0.05,方差齐性,且正态检验结果为正态分布,所以可以用多因素方差分析。(P值>0.05,方差齐,事后多重比较用“LSD”;否则,方差不
齐,事后多重比较用“Dunnett’s C ”; S-N-K法多重比较结果为无差别表达方式,即把差别没有显著性意义的比较组在同一列里)
表4 主体间效应的检验 因变量:成绩 源 校正模型 截距 组别 性别 误差 总计 校正的总计 III 型平方和 2620.532 189925.633 2620.232 59.266 2068.834 194615.000 4689.367 adf 3 1 2 1 26 30 29 均方 873.511 189925.633 1310.116 59.266 79.571 F 10.978 2386.884 16.465 .745 Sig. .000 .000 .000 .396 a. R 方 = .559(调整 R 方 = .508) 表4 主体间效应的检验,“组别”P=0.000<0.01,说明“组别”的主效应极显著;
“性别”P=0.396>0.05,说明 “性别” 的主效应不显著。由于“性别”只有两个水平,所以没有“性别”的事后多重比较。 表5 多个比较 因变量:成绩 LSD (I) 组别 1 (J) 组别 2 3 均值差值 (I-J) 标准 误差 7.80 22.30 -7.80 14.50 -22.30 -14.50 ****95% 置信区间 Sig. .061 .000 .061 .001 .000 .001 下限 -.40 14.10 -16.00 6.30 -30.50 -22.70 上限 16.00 30.50 .40 22.70 -14.10 -6.30 3.989 3.989 3.989 3.989 3.989 3.989 2 1 3 3 1 2 基于观测到的均值。 误差项为均值方 (错误) = 79.571。 *. 均值差值在 .05 级别上较显著。 表5 多个比较,组1和组2的P=0.061>0.05,说明组1和组2无显著性差异;组1和组3的P=0.000<0.01,说明组1和组3有极显著性差异;组2和组3的P=0.001<0.01,说明组2和组3有极显著性差异。
表6 成绩 Student-Newman-Keuls a,,b子集 组别 3 2 1 Sig. N 10 10 10 1 67.30 2 81.80 89.60 .061 1.000 已显示同类子集中的组均值。 基于观测到的均值。 误差项为均值方 (错误) = 79.571。 a. 使用调和均值样本大小 = 10.000。 b. Alpha = .05。 表6 为S-N-K多重比较结果,说明组1和组2无显著性差异,组1和组3有显著性差异,组2和组3有显著性差异。
SNK法多重比较结果是把差别没有显著性意义的比较组在同一列里,有差异的放在不同列里。 每一列最下面有一个“显著性”P值,表示列内部水平的差异的P值;检验水准α=0.05,不同列间差异有显著意义,同列间各组差异无显著意义。
我的前三个浓度之间无显著差异,倒数2-5个浓度之间无差异。
情况二 考虑交互效应:(包括4、5步)(区别用下划线)
4多因素方差分析操作过程
“分析”→ “一般线性模型”→“单变量”,出现“单变量”窗口,将因变量“成绩”放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模
多因素方差分析讲解



