C、方差齐性(即先作F检验,如F
2.方差分析
目的:又称为变异系数分析或F检验。用于推断两组或多组资料的总体平均数是否相同,检验两个或多个样本平均数的差异是否具有统计意义(也可认为是检验多个总体均值是否有显著性差异注1,这样可能更简单一点)。
基本思想:用组内均方去除组间均方的商,即F值,与1比较,若F值接近1,则说明各验均数间的差异没有统计学意义,否则表示有统计学意义。 应用条件:A、各组资料具有可比性 B、具正态分布
C、方差齐性 (即F检验)
提示,在应用SPSS中,只要死死的记住一个显著系数0.05就可以应用(如果是双尾系数需要除以2),一般的大于0.05接受原假设,小于0.05则拒绝。简单的说,一般结果拒绝就是说样本有差异,样本相对独立,都是表示同一种意思,读这方面书的时候,希望不要让这些名词混乱了思路。
SPSS的方差检验中,需要注意下面问题:
方差检验中,Post Hoc键有LSD的选项:当方差分析F检验否定了原假设,即认为至少有两个总体的均值存在显著性差异时,须进一步确定是哪两个或哪几个均值显著地不同,则需要进行多重比较来检验。LSD即是一种多因变量的三个或三个以上水平下均值之间进行的两两比较检验。
2 Independent Samples检验中的Mann-Whitney U检验与K Independent Samples中的Kruskal-Walllis(克鲁斯卡尔—瓦里斯)H检验法思想类似,常用来作为非参数检验。 2 Related Samples非参数检验中,一般有Sign普通符号检验法和Wilcoxon威尔科克森符
号秩检验法。前者用于研究的问题只有两个可能的结果:“是”或“非”,并且二者遵从二项分布;后者是普通符号检验法的改进,除了可以检验是非外,还可以了解差异的大小。 K Related Samples非参数检验中,主要有Friedman秩和检验与Cochran Q检验二种选择,前者是对多个样本是否来自同一总体的检验,而后者是用于只分为“成功”和“失败”两种结果的定类尺度测量的数据。
附录:SPSS假设检验方法使用对照表
图13
其中相关、配对或有交互作用可以理解为EXCEL的重复,独立或无交互作用可以理解为EXCEL中的无重复。图13表大部分参考《数据分析与SPSS应用》一书,特别说明
3.回归分析
目的:研究一个变量Y与其它若干变量X之间的一种数学工具。它是一组试验或观测数据的基础上,寻找被随机性掩盖的变量之间的依存关系。 A.直线回归方程 Yc=a bX
B.回归关系的检验:求回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系。
a. 方差分析:基本思想是将总变异分解为SS回归和SS乘余,然后利用F检验来判断方程是否成立。
b. t检验:基本思想是利用样本回归系数b与总体平均数回归系数进行比较来判断回归方程
是否成立。
下面摘录《数据分析与SPSS应用》一书关于相关回归和时间序列分析一些概念解释。
数据变量间主要存在二类关系: 一类是函数关系,一类是相关关系。 前者是变量间有确定关系,即一个变量的值能够在其他变量取值确定的情况下,按某种函数关系唯一确定;后者是变量间虽然具有的联系,并非确定关系,如价格与销量量,价格高了,销售量可能会上去,但无法确定销售量是多少。
通过散点图来观察,如果点都集中在一条直线附近,是线性相关,如果在一条曲线附近,则为非线性相关。
如果一个变量因另一个变量的增加而增加,减少而减少,则二个变量间存在正相关关系,反之则为负相关关系。极端的相关是完全相关和零相关。如某地区购买自行车多少与购买大蒜多少无关,是为零相关。
按我的理解,相关分析就是推断变量与变量之间关系的密切程度,回归就是在相关的基础上,找出变量间的拟合模型,从而进一步推测出未来的趋势和变量。而时间序列则是以时间的作为观察的序列,来推断变量间的关系的一种模型。
以自带文件Trends chapter 13.sav为例,说明一下如何应用这三种分析工具。 1.相关
打开Trends chapter 13.sav文件,可以看到,这个文件的数据是以时间来排序的,在每个值前增加一行序列号变量,如图14
图14
一个时间序列的影响因素有四种变动:A长期趋势(Secular Trend),B季节变动(Seasonal Variation),C循环变动(Cyclical Variation),D不规则变动(Irregular Variation)。 我们可以观察一下这些数据是否存在某种关系,打开Graphs->Sequence,如图15
图15
把hstarts选入Variables项,把No.选入Time Axis Lables,然后按OK,出现图16:
图16
从图可以看出,数据总是在一个周期内反复在上下波动,虽然高低的位置不一样,但这种波动显然是随着时间的不同而变化。
因此可以察看,因变量与时间的关系如何。选择Data->Define Dates,出现图17