SPSS学习笔记
描述样本数据
一般的,一组数据拿出来,需要先有一个整体认识。除了我们平时最常用的集中趋势外,还需要一些离散趋势的数据。这方面EXCEL就能一次性的给全了数据,但对于SPSS,就需要用多个工具了,感觉上表格方面不如EXCEL好用。 个人感觉,通过描述需要了解整体数据的集中趋势和离散趋势,再借用各种图观察数据的分布形态。对于SPSS提供的OLAP cubes(在线分析处理表),Case Summary(观察值摘要分析表),Descriptives (描述统计)不太常用,反喜欢用Frequencies(频率分析),Basic Table(基本报表),Crosstabs(列联表)这三个,另外再配合其它图来观察。这个可以根据个人喜好来选择。
一.使用频率分析(Frequencies)观察数值的分布。频率分布图与分析数据结合起来,可以更清楚的看到数据分布的整体情况。
以自带文件Trends chapter 13.sav为例,选择Analyze->Descriptive Statistics->Frequencies,把hstarts选入Variables,取消在Display Frequency table前的勾,在Chart里面histogram,在Statistics选项中如图1
图1
分别选好均数(Mean),中位数(Median),众数(Mode),总数(Sum),标准差(Std. deviation),方差(Variance),范围(range),最小值(Minimum),最大值(Maximum),偏度系数(Skewness),峰度系数(Kutosis),按Continue返回,再按OK,出现结果如图2
图2
表中,中位数与平均数接近,与众数相差不大,分布良好。标准差大,即数据间的变化差异还还小。峰度和偏度都接近0,则数据基本接近于正态分布。下面图3的频率分布图就更直观的观察到这样的情况
图3
二.采用各种图直观观察数据分布情况,如采用柱型图观察归类的比例等。
同样以自带文件Trends chapter 13.sav为例,我们可以观察一下各年的数据总和的对比: 1. 选择Graph->Bar->Simple,在“Data in chart are”一项选择Summary of groups of cases,然后按Define,出现图4,
图4
2. 选择Bars Represent->Other statistic(e.g. mean),把hstarts一项选入Variable里
面,把YEAR, Periodic一项选入Category Axis项中,并按Change Statistic键,出现图5:
图5
3.在Statistic选项中选Sum of values一项,按Continue返回,按OK即可出现图6:
图6
从图中可以非常直观的看出1965年-1975年间,每年的总体数量对比和各数值多少。 三.通过列联表来观察,数据的交错关系。
以软件自带的文件University of Florida graduate salaries.sav来说明
1、选择Tables->Basic Table,在弹出对话框中,选择Graduate到Summaries栏,College到Down ,Gender到Across栏,如图7
图7
2、选择Statistics按键,选取Count和layer%到Cell Statistics一栏,并按Continue键,如图8