SPSS最适用的统计学方法(X检验和T检验)
2
1. SPSS的启动 话框,
(1) 在windows[开始]→[程序]→[spss20],进入SPSS for Windows对2.创建一个数据文件
三个步骤:
(1)选择菜单 【文件】→【新建】→【数据】新建一个数据文件。 (2)单击左下角【变量视窗】标签进入变量视图界面,定义每个变量类型。 (3)单击【数据视窗】标签进入数据视窗界面,录入数据库单元格内。 3.读取外部数据
当前版本的SPSS可以很容易地读取Excel数据,步骤如下:
(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图所示。
图 Open File对话框
(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框,如图所示。对话框中各选项的意义如下:
工作表 下拉列表:选择被读取数据所在的Excel工作表。 范围 输入框:用于限制被读取数据在Excel工作表中的位置。
图 Open Excel Data Source对话框
4.数据编辑
在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中。 5.SPSS数据的保存
SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。在数据保存对话框(如图所示)中根据不同要求进行SPSS数据保存。
图 SPSS数据的保存
5. 数据分析
在SPSS中,数据整理的功能主要集中在【数据】和【分析】两个主菜单下 6.语言切换:编辑(E)—选项(N)--用户界面-语言--简体中文 第六章:描述性统计分析(X2检验)
完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也 在其中完成。 6.1.1界面说明
界面如下所示: 分析—描述统计—频率 用于定义需要计算的其他描述统计量。 现将各部分解释如下:
Percentile Values复选框组定义需要输出的百分位数,可计算 1.四分位数(Quartiles)、
2.每隔指定百分位输出当前百分位数(Cut points for equal groups) 3.直接指定某个百分位数(Percentiles),如直接和
o Central tendency复选框组 用于定义描述集中趋势的一组指标:均数(Mean)、
中位数(Median)、众数(Mode)、总和(Sum)。
o Dispersion复选框组 用于定义描述离散趋势的一组指标:标准差、
方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误。
o Distribution复选框组 用于定义描述分布特征的两个指标:偏度
系数(Skewness)和峰度系数(Kurtosis)。
o Values are group midpoints复选框 当你输出的数据是分组频数
数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
【Charts钮】
弹出Charts对话框,用于设定所做的统计图。
o Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、
圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。
例:许根友要求统计的。丙氨酸氨基转移酶(ALT)调查,男性244人有50人异常,女性255人有6人结果异常,结果是否有统计学意义。
X2卡方值是,P<
6.1.2 分析实例
例 某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算
均数、标准差、变异系数CV、中位数M、和(卫统第三版p233 题)。
解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:
1. Analyze==>Descriptive Statistics==>Frequencies (分析—描述统计—频率
--) 2. Variables(变量)框:选入X 3. 单击Statistics(统计量)钮:
4. 选中Mean(均数)、(标准差)、Median(中位数)复选框
5. 单击Percentiles(百分位数):输入:单击Add(添加):输入:单击Add: 6. 单击Continue钮 7. 单击Charts(图表)钮:
8. 选中Bar charts (条形图)
9. 单击Continue钮 10.单击OK
得出结果后手工计算出CV。
6.1.3 结果解释
上题除直方图外的的输出结果如下:
Frequencies
统计量
X N 均值 中值 标准差
25
百分位数
有效 缺失
101 0 .86162 最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=,中位数Median=,标准差STD=,=,=。
系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
§ Descriptives过程
最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数
Mean=,中位数Median=,标准差STD=,=,=。
X
有效
频率
1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 2 百分比
有效百分比
累积百分比
1 2 2 2 1 1 1 2 1 1 1 2 1 1 1 2 1 1 系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
Descriptives过程(描述性统计分析)
以上面的题为例,分析—统计描述—描述—选项—均值、标准差、方差、最小值、最大值、均值的标准误、变量例表---继续---确定。
下面是一个典型的Descriptives过程结果统计表: 描述统计量 X 有效的 N (列表状态) N 统计量 101 101 极小值 统计量 极大值 统计量 均值 统计量 标准误 .08573 标准差 统计量 .86162 § Crosstabs过程(交叉表)
Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常
222
用的X检验、Kappa值,分层X(XM-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。
6.4.2 分析实例
例 某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别(医统第二版P37 例)?