好文档 - 专业文书写作范文服务资料分享网站

描述性统计分析DescriptiveStatistics

天下 分享 时间: 加入收藏 我要投稿 点赞

第二讲:一般数据分析

教学目的:能应用SPSS软件进行:描述分

析、频数分析、数据探索、交叉表分析、图形分析等

教学内容:1)描述分析 2)频数分析 3)数据探索 4)交叉表分析

教学重点:描述分析、频数分析、交叉表 教学难点:数据探索、交叉表分析 教学时间:1学时

描述性统计分析Descriptive Statistics

描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:

●Frequencies过程的特色是产生频数表; ●Descriptives过程则进行一般性的统计描述; ●Explore过程用于对数据概况不清时的探索性分析;

●Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,常用的X2 检验也在其中完成。 1.1 Frequencies过程

频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图、饼图等统计图。和国内常用的频数表不同,几乎所有统计软件给出的都是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到熟悉的频数表,请先用第3章学过的Recode过程产生一个新变量来代表所需的各

1 / 29

组段。

1.1.1 界面说明

Frequencies对话框的界面如图1.1a所示。选取Analyze→Descriptive Statistics→Frequencies,系统就会弹出该对话框,其各部分的功能如下:

1.Variable(s)框:左侧的变量可全部选入右侧的Variable(s)框内,一次性完成所有变量的频数分析;也可逐一选入右侧,进行分析n次分析(这样就太累了)。

2.Display frequency tables复选框:确定是否在结果中输出频数表。

图1.1a Frequencies对话框

3.Statistics:单击后弹出Statistics对话框如图1.1b,用于定义需要计算的其他描述统计量。其中:

●Percentile Values复选框组:定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5(即累计百分数为2.5%处的变量值)和P97.5(即累计达到97.5%处的变量值)。

●Central tendency复选框组:用于定义描述集中趋势的一组指标:均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。

●Dispersion复选框组:用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。

●Distribution复选框组:用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。

●Values are group midpoints复选框:当输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框,以通知SPSS,免得它犯错误。

2 / 29

图1.1b Frequencies的Statistics对话框

4.Charts:弹出Charts对话框,用于设定所做的统计图。

●Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。

●Chart Values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。 5.Format:弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。

●Order by单选钮组 定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。

●Multiple Variables单选钮组 如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。

●Suppress Tables more than...复选框 当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。 1.1.2 实例分析

例1.1 利用111.sav文件中q9(即被访问者最近一次参加促销活动的消费)的调查数据,绘制频数表、直方图,计算平均值、标准差、变异系数CV、中位数Mode、p2.5和p97.5。

●求解

上述要求中,除CV需用手工计算外,其他问题都可通过Frequencie解决。其主要操作如下:

3 / 29

2dijy6gmfj7yqpo85se79mzf00wron00itf
领取福利

微信扫码领取福利

微信扫码分享