好文档 - 专业文书写作范文服务资料分享网站

spss方差分析操作示范-步骤-例子

天下 分享 时间: 加入收藏 我要投稿 点赞

第五节 方差分析的SPSS操作

一、完全随机设计的单因素方差分析 1.数据

采用本章第二节所用的例1中的数据,在数据中定义一个group变量来表示五个不同的组,变量math表示学生的数学成绩。数据输入格式如图6-3(为了节省空间,只显示部分数据的输入):

图 6-3 单因素方差分析数据输入 将上述数据文件保存为“6-6-1.sav”。 2.理论分析

要比较不同组学生成绩平均值之间是否存在显著性差异,从上面数据来看,总共分了5个组,也就是说要解决比较多个组(两组以上)的平均数是否有显著的问题。从要分析的数据来看,不同组学生成绩之间可看作相互独立,学生的成绩可以假设从总体上服从正态分布,在各组方差满足齐性的条件下,可以用单因素的方差分析来解决这一问题。单因素方差分析不仅可以检验多组均值之间是否存在差异,同时还可进一步采取多种方法进行多重比较,发现存在差异的究竟是哪些均值。

3.单因素方差分析过程 (1)主效应的检验

假如我们现在想检验五组被试的数学成绩(math)的均值差异是否显著性,可依下列操作进行。 ①单击主菜单Analyze/Compare Means/One-Way Anova…,进入主对话框,请把math选入到因变量表列(Dependent list)中去,把group选入到因素(factor)中去,如图6-4所示:

精选资料,欢迎下载

图6-4:One-Way Anova主对话框

②对于方差分析,要求数据服从正态分布和不同组数据方差齐性,对于正态性的假设在后面非参数检验一章再具体介绍;One-Way Anova可以对数据进行方差齐性的检验,单击铵钮Options,进入它的主对话框,在Homogeneity-of-variance项上选中即可。设置如下图6-5所示:

图6-5:One-Way Anova的Options对话框 点击Continue,返回主对话框。

③在主对话框中点击OK,得到单因素方差分析结果 4.结果及解释

(1)输出方差齐性检验结果

Test of Homogeneity of Variances

MATH

Levene Statistic df1 df2 Sig.

1.238

4 35 .313

上表结果显示,Levene方差齐性检验统计量的值为1.238,Sig=0.313>0.05,所以五个组的方差满足方差齐性的前提条件,如果不满足方差齐性的前提条件,后面方差分析计算F统计量的方法要稍微复杂,本章我们只考虑方差齐性条件满足的情况。

(2)输出方差分析主效应检验结果(方差分析表)

精选资料,欢迎下载

ANOVA MATH

Sum of Squares df Mean Square

Between Groups Within Groups

Total

314.400

4

846.000 35 1160.400 39

24.171

F Sig.

78.600 3.252 .023

上面方差分析结果显示:组间平方和为314.40,组内平方和为846.00; 组间自由度为4,组内自由度为35; 组间均方为78.60,组内均方为24.171;F检验统计量的值为3.252,对应的概率P值为0.023<0.05,说明在0.05的显著性水平下,在不同班主任的班级中数学成绩有显著差异。

5.单因素方差分析的Post Hoc多重比较

上面分析结果显示,五个组的平均值存在显著差异,但是并不能告诉我们究竟是哪些组之间的差异显著。如果想同时回答存在差异的原因,就需要进行平均数的多重比较。SPSS可以直接进行平均数差异的多重比较,具体操作如下:

(1)在One-Way Anova的主对话窗口,单击按钮Post Hoc…进入多重比较方法选择对话框(如图6-6所示)。

图6-6:单样本方差分析多重比较定义窗口

(2)在上面对话框中有两组不同假设下的方法可供选择,上面为方差齐性前提下(Equal Variances Assumed)的方法,下面为没有假定方差齐性时(Equal Variances Not Assumed)的多重比较方法选择。

单因素方差分析的Post Hoc提供的多重比较的方法在方差齐性的假设条件下常用的主要有:LSD(最小显著差法),Duncan(Duncan多范围检验),S-N-K(Student-Newman-Keuls检验,有称q检验),Tukey(Honestly显著差异检验),Tukey’s-b(Tukey的另一种检验方法),Bonferroni (Bonferroni检验),Scheffe(Scheffe检验)等,不同检验方法所依据的检验准则稍有差异,检验结果也不完全相同,这里不具体介绍各种方法的具体检验原理,感兴趣的读者可以参考有关文献(Miller,1966; Games,1971a,1971b;)。由于在本书中只涉及方差齐性条件满足的情况,所以关于没有方差齐性假设条

精选资料,欢迎下载

件或方差齐性条件不满足时的多重比较方法这里不作介绍。

在上面所举的例子中,不同任课教师担任办主任的班级,其数学成绩存在显著差异,下面我们进一步检验究竟是那两个组的差异显著。在多重比较窗口,选择S-N-K检验,单击Continue返回主对话框。

(3)在主对话框点击OK按钮运行程序,即可输出结果。 6.多重比较结果及解释

这时的输出结果,除了上面显示的方差齐性的检验结果和方差分析表外,还有多重检验的结果,多重检验结果为:

MATH

Student-Newman-Keuls N Subset for alpha = .05

GROUP 4 3 2 5 1 Sig.

8 8 8 8 8

1 67.00 69.50 71.50 .175

2 69.50 71.50 74.00 74.50 .195

Means for groups in homogeneous subsets are displayed.

a Uses Harmonic Mean Sample Size = 8.000.

上述分析结果表明,在0.05的显著性水平下,5个组可以分成同质的2个大组,第一大组包括原来的第4组、第3组和第2组;第2大组包括原来的第3组、第2组、第5组和第1组。说明第4组、第5组与第1组的数学平均成绩存在差异,而第4组与第2组和第3组的差异不显著,第1组、第5组和第2组和第3组的差异也不显著。

二、随机区组设计的方差分析

在随机区组设计中,每一区组应接受全部实验处理,每种实验处理在每一区组中重复的次数也应该相同。利用SPSS程序可以进行被试之间的差异检验、处理之间的差异检验及各种交互效应的检验。SPSS中没有提供可直接用于区组设计的分析程序,但用户可以根据实验设计中具体情况选择普通因素模型(即所有的因素变量都是被试间因素)或重复测量模型(至少有一个因素变量是被试内因素)。同一区组内的每一个被试如果接受了全部实验处理,应该选择重复测量模型;如果同一区组内的被试随机接受不同的实验处理,即一个被试只接受一种处理,则应选择普通因素模型。不同的模型对数据的表现形式会有所不同。普通因素模型要求实验处理结果即因变量只表现为一个,不同水平下的观测结果用因素变量的变量值加以对应区分。在重复测量模型中,不同的实验处理结果应表现为不同的变量,不要求因素变量必须存在。下面我们先介绍普通因素模型。

(一)、随机区组设计的普通因素模型(被试间设计) 1. 数据输入

例7.为了研究四种夹角(15度、30度、45度和60度)条件下,缪勒-莱尔错觉试验错觉量之间

精选资料,欢迎下载

的差异,随机选取4组同质被试,每组8名,总共32名被试。每组同质的8名被试再随机分成4组,每组2人随机接受一种夹角下的缪勒-莱尔错觉试验,试验结果如下表:

区组1

15度

30度 10.3 9.4 9.8 9.7 10.5 11.2 9.5 9.2

45度 9.7 8.8 9.7 9.5 9.7 10.1 8.9 9.0

60度 8.8 8.4 8.8 9.0 9.0 9.4 8.3 8.0

10.5 9.5 10.2

区组2

9.8 10.6

区组3

11.2 9.5

区组4

9.5

分析四种不同夹角条件下,缪勒-莱尔错觉试验的平均错觉量有无显著差异,并进一步说明哪些组存在差异。

我们在句法窗口(syntax)用语句输入数据,具体语句如下(文件6-6-2.sps):

DATA LIST FREE/ BLOCK COND DELUSION. BEGIN DATA.

1 1 10.5 1 2 10.3 1 3 9.7 1 4 8.8 1 1 9.5 1 2 9.4 1 3 8.8 1 4 8.4 2 1 10.2 2 2 9.8 2 3 9.7 2 4 8.8 2 1 9.8 2 2 9.7 2 3 9.5 2 4 9.0 3 1 10.6 3 2 10.5 3 3 9.7 3 4 9.0 3 1 11.2 3 2 11.2 3 3 10.1 3 4 9.4 4 1 9.5 4 2 9.5

精选资料,欢迎下载

4 3 8.9 4 4 8.9 4 1 9.5 4 2 9.2 4 3 9.0 4 4 8.0 END DATA.

在句法窗口选择菜单Run/All,得到数据文件,保存为“6-6-2.sav”。 2.理论分析

在上述数据文件中,共有三个变量依次是区组变量BLOCK ,实验处理的条件COND,实验结果即错觉量DELUSION。其中BLOCK 与COND都是因素变量,并且各有四个水平。上述实验数据的表现是基于如下假设:样本容量为32,分4个区组,每个区组有8名被试,共有4种不同的实验处理条件;在实验中,随机安排同一区组内的两名被试接受同一种实验处理,这样每一区组的被试又被随机分成了4组,每一组接受一种不同的实验处理。

现在我们的目的在于检验四种实验处理条件下错觉量是否有显著性差异,也想检验四个区组之间是否存在显著性差异。所以从理论上属于区组设计的实验设计。

3.随机区组被试间设计的SPSS操作过程

(1)单击主菜单Analyze/general linear model / Univariate…,打开主对话框。把变量DELUSION选入到因变量(dependent)框中,同时我们假定目前的区组数目及实验处理条件已经全部包括在实验中,所以把BLOCK 与COND都选入到固定因素(fixed factors)框中,如下图6-7所示:

图6-7:一般因素方差分析主对话框

(2)指定分析模型

即指定在方差分析中需要哪些因素主效应或交互效应。单击按钮Model…,进入模型(Model)

精选资料,欢迎下载

设置对话框。

①Full factorial 全模型,包括所有因素主效应、交互效应、协变量主效应等。是系统默认的模型。

②Custom 自定义模型。用户可以选择自己实验中感兴趣的效应。

Build terms单击向下的小三角可以选择多种不同的效应,如本例中我们选择两个因素的主效应Main effects。

③Sum of 提供了四种分解平方和的方法,系统推荐第三种即回归法。

④Include intercept in model 如果选中该复选框,表明在模型中包括截距。如果你能确定回归线不通过原点,可以把截距排除在外。

⑤Factors&框中所列出的是主对话框中所选的因素,一般包括固定因素(变量名后附以F)、随机因素(变量名后附以R)、协变量因素(变量名后附以C)。在上面定义的模型中只含有固定因素。 本例中我们所感兴趣的是COND中四种水平下实验结果的差异性,同时也想检验区组效应,对于区组设计假设因素与区组间不存在交互作用,所以只选择了两个固定因素的主效应。点击Continue返回主对话框。上述设置如下图6-8所示:

图6-8:模型定义对话框

(2)选择输出图形

单击主对话框按钮plot…,可进入图形设置对话框。我们在此把BLOCK作为横坐标选入到horizontal axis),把COND选入到Separate lines框中,然后单击ADD按钮。即要求程序为我们在一个图中输出四种处理条件下的折线图,以便于我们判断处理条件与区组是否存在交互作用。点击Continue返回主对话框。上面设置如下图6-9所示:

图6-9:图形设置对话框

(3)选择多重比较的因素变量及方法

精选资料,欢迎下载

单击POST HOC…按钮进入定义事后检验的对话框。左边列出了因素变量,如果需要,用户可以把指定进行多重比较分析的变量选入到右边变量列中,并在下面选择多种比较的方法,请注意,上半部分是方差齐性假设下的方法,下半部分是方差不齐时的方法。在方差齐性假定满足的条件下,系统推荐使用Bonferroni 方法与 Tukey 方法。在本例中,由于我们在OPTIONS中进行COND各水平的比较,所以在此不再重复选择。(本例图略,请读者自行操作并查看。)点击Continue返回主对话框。 (4)选项按钮的使用

单击Options…按钮进入到它的对话框如图6-10所示,我们可以要求显示指定的因变量各水平的平均数并比较各水平下的均值差异性。本例中我们指定显示COND的各水平下的均值并对之进行多重比较。为此我们把COND选入到右边框中,并选中它下面的要求比较主效应的复选框,系统默认的多重比较的方法是LSD。

同时,还需要对对COND各水平的方差是否齐性进行检验。为此,我们选中Homogeneity tests。如果需要观察该变量的残差图,还可以选择Resual plots,系统会产生分别以残差的观测值、预测值和标准化值为坐标的图。

最下面一行用来定义显著性水平,系统默认值是0.05。设置完成后,点击Continue返回主对话框。

图6-10:Options选择对话框

5)点击ok,得到输出结果。

4.随机区组被试间设计SPSS输出结果及解释

精选资料,欢迎下载

(1) 输出组间因素描述结果。

Between-Subjects Factors

N BLOCK 1

2 3 4 COND 1

2 3 4

8 8 8 8 8 8 8 8

上表列出了两个组间因素的水平数及各水平的被试数目,如对于组间因素COND,共有4个不同的处理水平,接受每种处理的被试为8人。

(2)输出因变量不同组方差的齐性检验结果 Levene's Test of Equality of Error Variances Dependent Variable: DELUSION F df1 df2 Sig. 1.378 15 16 .266

Tests the null hypothesis that the error variance of the dependent variable is equal across groups.

a Design: Intercept+BLOCK+COND

本例中由于Sig=.266<.05,所以差异不显著,方差齐性。 (3)输出组间因素效应检验结果 Tests of Between-Subjects Effects Dependent Variable: DELUSION

Source Type III Sum of Squares df Mean Square

Corrected Model Intercept

BLOCK COND Error Total

Corrected Total

13.999 2928.038 5.531 8.468 3.193 2945.230 17.192

6 1 3 3 25 32 31

F Sig.

2.333 18.269 .000 2928.038 22926.791 .000 1.844 14.436 .000 2.823 22.103 .000 .128

a R Squared = .814 (Adjusted R Squared = .770)

上述结果显示:总的平方和(17.192)被分解为处理(此处用变量COND表示)平方和(8.468)、区组平方和(5.531)和误差平方和(3.193)三个部分。检验结果表明:COND因素主效应显著(F=22.103,P<0.05),BLOCK因素主效应显著(F=14.436,P<0.05)。

(4)因变量DELUSION在COND四个水平上的平均值、标准差及置信区间 Estimates

Dependent Variable: DELUSION

精选资料,欢迎下载

COND

Mean Std. Error 95% Confidence Interval

10.100 9.950 9.425 8.787

.126 .126 .126 .126

Lower Bound Upper Bound

9.840 10.360 9.690 10.210 9.165 9.685 8.527 9.048

1

2 3 4

上述结果显示,15度夹角条件下,错觉实验得到错觉量的平均值为10.100,标准误为0.126,95%的置信区间为(9.840,10.360);30度夹角条件下,错觉实验得到错觉量的平均值为9.950,标准误为0.126,95%的置信区间为(9.690,10.210);45度夹角条件下,错觉实验得到错觉量的平均值为9.425,标准误为0.126,95%的置信区间为(9.165,9.685);60度夹角条件下,错觉实验得到错觉量的平均值为8.787,标准误为0.126,95%的置信区间为(8.527,9.048)。 (5)因变量DELUSION在COND 四个水平上的平均数的多重比较表 Pairwise Comparisons

Dependent Variable: DELUSION

Mean Difference Std. Sig. 95% Confidence Interval

(I) COND (J) COND (I-J) Error for Difference

Lower Bound Upper Bound

1

2 3 4

2 3 4 1 3 4 1 2 4 1 2 3

.150 .675* 1.313* -.150 .525* 1.163* -.675* -.525* .638* -1.313* -1.163* -.638*

.179 .409 .179 .001 .179 .000 .179 .409 .179 .007 .179 .000 .179 .001 .179 .007 .179 .001 .179 .000 .179 .000 .179 .001

-.218 .307 .944 -.518 .157 .794 -1.043 -.893 .269 -1.681 -1.531 -1.006

.518 1.043 1.681 .218 .893 1.531 -.307 -.157 1.006 -.944 -.794 -.269

Based on estimated marginal means

* The mean difference is significant at the .05 level.

a Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments).

上述多重比较结果显示,第1种条件下错觉量的平均值显著大于第3种(平均数的差为0.675,对应的P<0.05)和第4种条件下(平均数的差为1.313,对应的P<0.05)的错觉量;第2种条件下错觉量的平均值也显著大于第3种(平均数的差为0.525,对应的P<0.05)和第4种条件下(平均数的差为1.163,对应的P<0.05)的错觉量;第3种条件下错觉量的平均值显著大于第4种(平均数的差为0.638,对应的P<0.05)。 (6) 因变量DELUSION的边缘平均数显示图(如图6-11所示)

精选资料,欢迎下载

1zl2l47pz66ksx797jw59jajr88l5800wtc
领取福利

微信扫码领取福利

微信扫码分享