Chapter 6 SPSS § 6.1 SPSS简介
SPSS是世界上最著名的统计分析软件之一。SPSS是软件英文名称的首字母缩写,原意
为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制,于1970年代推出的,迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。与SAS相比较而言,SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发。
现应用于多个领域和行业,是世界上应用最广泛的专业统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。
例如,SPSS的预测分析能有助于:
●企业解决客户生活周期的问题,例如吸引新的客户,尽量久的留住最好的客户,以及改善与客户的相互作用。
●研究人员和分析家揭示各种关系和趋势
●教育工作者帮助学生更好的进入商业、学术和公共事业领域 ●政府机构致力于减少欺诈、犯罪以及不服从
●独立软件供应者(ISVs)将预先开发好的SPSS组件集成到他们自己的应用软件中,可以提供更好的解决方案
以下是SPSS预测分析技术在各个领域使客户受益的一小部分例子:
●某大银行使用SPSS软件提高营销效率,销售额上升了50%,关键营销成本则下降了30%。
●一家精确电子邮件行销的供应商使用SPSS软件帮助它的客户定位市场营销活动,从而使自己的收入增长了60%。
●某大医院的一个医学研究人员使用SPSS软件更为有效的分析基因表达数据,使小儿脑瘤的研究和治疗得到了更快速的发展。
●一个业内领先的为网上商务提供支付处理和欺诈探测解决方案的公司使用SPSS软件帮助它的客户减少欺诈带来的损失,结果客户拒付的比例减少了700%,同时风险管理成本也下降了,因为需要人工复审的交易数下降了40%。
●一家主要金融服务公司使用SPSS软件来确认更有利可图的地方来开展新业务,预测的错误下降了50%。
●加利福尼亚一家大学使用SPSS软件来降低招生方面的营销成本、改进课程设置及增加课程对学生的吸引力。
SPSS 公司于2004年6月正式推出SPSS12.0中文版。 一、SPSS的主要特点
1、工作界面友好:工作界面友好、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置,点击功能按钮来完成,不需要用户记忆大量的操作命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。与Windows的其他应用软件相似。
2、完善的数据转换接口:可以方便地和Windows其他应用程序进行数据共享和交换。可以读取Excel、Foxpro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCⅡ数据文件。是一种开放型的统计软件。
3、能满足不同层次、不同领域统计人员的需要:提供基础统计(Basic Statistics)、专业统计(Professional Statistics)、高级统计(Advanced Statistics)等几十种统计方法,提供强大的程序编辑能力和二次开发能力,具有丰富的内部函数和统计功能,方便高级用户完成更为复杂的统计分析任务的需要。
4、强大的统计图绘制和编辑功能:在SPSS11.0以后的版本中,增强了三维统计图的绘制功能,图形更为美观大方,输出报告形式灵活、编辑方便易行。
5、丰富的指导协助功能:附带丰富的数据资料和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。软件启动后,用户可以直接上网访问SPSS公司主页获得更多的帮助和信息。
SPSS中国网站:http://www.spss.com.cn/index.php?username= 二、对系统软硬件的要求
SPSS11.0的版本建议使用PentiumⅡ以上的CPU;至少要配备32MB的内存;需要90MB的硬盘空间用以安装和运行(完全安装);支持Windows的标准VGA显示器;配备CD-ROM驱动器、标准PC配置的鼠标、键盘。
操作系统要求Windows98/ME/NT/2000及更高的版本。 三、SPSS的安装、启动与退出
1、安装模式:Typical(系统默认值),典型安装,适合大多数用户;Compact,压缩安装,也称“最小安装”,适合于计算机配备较低的用户;Custom,由用户自行定义的安装,适合于高级用户。
此外,SPSS内高级的语法命令说明都是以Acrobat Reader文件格式存放的,所以,还应该决定是否安装相应的Acrobat Reader软件。
2、启动
Startup对话框,该对话框提供了选择进入SPSS的各种方式: Run the tutorial:运行指南 Type in data:数据录入
Run an existing query:运行已存在的查询
Create new query using Database Capture Wizard:用数据库捕获向导建立新的查询 Open the existing file:打开现有的文件
Open another type of file:打开其他类型的文件 3、退出 (1)、单击SPSS Data Editor 窗口右上角的关闭按钮 (2)、选择SPSS Data Editor 窗口主菜单的“File-Exit”命令 (3)、双击SPSS Data Editor 窗口左上角的窗口图标 (4)、单击SPSS Data Editor 窗口最上角的窗口图标,在显示出的菜单中单击关闭命令
(5)、直接按Alt+F4组合键 四、 SPSS窗口介绍
SPSS同其他windows的应用程序一样,其工作环境是由窗口、菜单、对话框等组成,因此,学习SPSS,要从认识这些基本组成开始。
1、窗口
在SPSS中,有几种不同类型的窗口,分别提供不同的操作环境和界面。 常用的有:Data Editor(数据编辑窗)、Result Viewer(结果输出窗)、Draft Viewer(草稿输出窗)、Pivot Table Editor(表格编辑窗)、Chart Editor(统计图表编辑窗)、Text Output Editor(文本编辑窗)、Syntax Editor(语法编辑窗)、Script Editor(程序编辑窗)等。数据编辑窗是SPSS默认的启动用户界面,它是SPSS的工作台面,用户可以在可以建立、读取、编辑数据文件,开展预想的统计分析工作。
窗口的基本结构(以数据编辑窗为例): 标题栏:显示当前工作文件名称。 菜单栏:排列SPSS的所有菜单命令。
工具栏:排列系统默认的标准工具图表按钮,此栏图表按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。
状态栏:位于SPSS窗口底部,反映了工作状态。当用户将光标置于不同的区域时或者进行不同的操作时其中显示不同的内容。
数据编辑栏:也称数据输入栏,用户可以通过键盘输入的数据首先显示在这里。
数据显示区域:它是一个二维表格,编辑确认的数据都将在这里显示,其中每个矩形格称为单元格(CELL)。其中边框加黑的单元格称为选定单元格。左边缘排列观测量序号,上边缘要定义变量名。
2、菜单
SPSS允许用户对菜单进行编辑,选择Utilities菜单中的Menu Edit选项,弹出菜单编辑对话框,可以将Windows下的其他外部应用程序、SPSS的语法程序、脚本程序添加到SPSS的菜单中,以后就可以在SPSS中方便的启动这些应用程序了。例如,将应用程序Microsoft PowerPoint 编辑到SPSS数据窗口的Utilities菜单中,这样便可以在数据窗口里打开这个程序。
File(文件)菜单 Edit(编辑)菜单
View(视图外观)菜单 Data(数据)菜单
Transform(数据转换)菜单 Analyze(统计分析)菜单 Graphs(图形)菜单
Utilities(实用程序)菜单 Windows(窗口控制)菜单 Help(帮助)菜单 3、对话框 (1)、General 列出了常规选项 (2)、Viewer Output 窗口显示时的信息、图标、字体等选项 (3)、Draft Viewer 草稿输出窗口的各种初始设置及功能选项 (4)、Output Labels 提供了输出中标签的设置选项
(5)、Charts 用于设置图形输出格式 (6)、Interactive 用于设置交互式的图形 (7)、Pivot Table 用于设置输出表格的格式 (8)、Data 用于设置有关数据的参数 (9)、Currency 设置数值型变量的输出格式 (10)、Scripts 设置启动SPSS用到的脚本程序文件
§ 6.2 数据文件的建立及整理
一、数据文件
1、打开数据文件 2、变量、观测量
(1)SPSS变量及其定义 ①Name (变量名) ? 变量名不能超过8个字符; ? 首字必须为字母,不能以数字开头,其后可以是字母、数字、符号,也可以使用汉字作为变量名。
? 变量名中不能包含+,-,×,/、?、=等运算和逻辑符号。 ? 变量名中不得使用SPSS的保留字,如:ALL、AND、BY、EQ、GE、LE、LT、NE、NOT、OR、TO、WITH
? 系统不区分大小写字母。 ②Type (变量类型)
SPSS变量有三种基本类型:Numeric(数值型)、String(字符型)和Date(日期型)。 数值型变量又可以分为6种不同类型,其中标准型是系统默认的基本类型。 数值型 变量类型 Numeric(标准数值型变量) Comma(带逗点型) Dot(带圆点型) Scientific Notation(科学记数法) Dollar(带美元符$型) Custom Currency(自定义型) 字符型 日期型 ③Variable Labels (变量标签)
变量标签是对变量名的附加说明。SPSS允许定义长达255字节的变量标签。 ④Value Labels (值标签,或标签值)
是对变量发可能取值附加的进一步说明,通常仅对类型或分类(即定序或定类)变量的取值指定值标签。
⑤Width(变量格式宽度)
变量格式宽度指在数据窗口中变量列所占据单元格的列宽度。系统默认宽度是8。 ⑥Alignment (单元格对齐格式)
变量在单元格的显示有左中右三种格式,一般情况下,对数值型变量默认为右对齐,字符型变量默认为左对齐。
String(字符型) Date(日期型) 输入格式 标准数值或科学记数法 带逗点格式、科学记数法 带圆点格式、科学记数法 标准数值、科学记数法 标准数值、科学记数法等 标准数值、科学记数法等 一串字符 按指定格式输入 显示格式示例 标准数据格式,231.05 带逗点格式,1,235.56 带圆点格式,1.235,56 科学记数法,6.7E+07 带美元符号,$5,670.80 在Option对话框中自行定义 Book,girl 05 按指定格式输出 ⑦Missing Value (缺失值)
统计中把那些没有观测到、或没有记录到,或者记录结果有明显错误的数值,成为缺失值。对数值型变量,系统默认缺失值为0,对字符型变量,系统默认缺失值为空格。
对话框里有3个单选项: No missing values:无缺失值
Discrete missing values:离散缺失值,可输入3个或少于3个的值。
Range plus one discrete missing values:缺失值范围外加一个离散缺失值。选择此项可以给出一个缺失值的范围,LOW为下限,HIGH为上限。
⑧Measurement (测度水平) 是指按照某种法则给现象、事物或事件分派一定的数字或符号,通过测度来刻画事物的属性或特征。
测度水平由高到低分别为:Scale,定比测度或比率测度;Ordinal,定序测度或顺序测度;Nominal,定类测度或名义测度。 (2)、观测量
SPSS中用Case表示观测量,案例或事件。统计学中指出,构成总体的单位具有各种各样的特征,将这些特征的名称称为“标志”。 3、数据文件的保存
二、数据录入及数据文件的编辑
1、数据的录入
依变量按列输入:回车或者下移光标 依观测量按行输入:Tab键或者右移光标
带有值标签的数据的输入方法:可直接输入变量值,可点击下拉菜单进行选择。Value labels(值标签控制开关)可转换是显示变量值还是显示值标签。
选中一行或一列输入:选中该行或该列,回车或者Tab键 2、数据文件的编辑
变量的插入与删除:右键或Data---Insert Variable 观测量的插入与删除:Delete键或者Edit----Clear 单元中数据的编辑 3、查询
按观测量序号查询单元格的位置:Data----Go To Case(定位到观测量),输入要查找的观测量序号
按变量查询单元格的位置:选中变量的任一单元格,执行Edit----Find(查寻),输入要查找的变量值
文件变量信息的查询:Utilities----Variable(变量),单击列表中的变量名,右边的矩形框中就会显示该变量的信息。Utilities---File Info(文件信息)可显示文件中所有变量的信息。 三、数据文件的整理 1、观测量分类整理:
执行Data----Sort Cases(观测量分类) 选择分类整理的依据变量 选择排序方式
2、文件的拆分:将数据按一个或几个分组变量分成一些供统计分析的分组。 执行Data ----Split File(文件拆分)
选择Compare(比较分组)或者Organize output by groups variables(按分组变量组织输出结果) Sort the file by grouping variables:按分组变量对文件分类整理