好文档 - 专业文书写作范文服务资料分享网站

spss简介(2)

天下 分享 时间: 加入收藏 我要投稿 点赞

SPSS简介

09经信管04谭国平

统计学( Statistics ) 是一门收集与分析数据,并且根据数据进行推断的艺术与科学。

统计学理论主要包含三个部分:

1.数据收集, 2.数据分析,

3.由数据做出决策。

一. 统计学的基本概念

统计学中把所研究的对象全体称为总体,总体中的每一个元素称为一个个体。总体与个体都用数量指标来表示。

1.总体与个体(population)

统计学中把所研究的对象全体称为总体,总体中的每一个元素称为一个个体。即使面临的是一个定性的实际问题,也必须把有关的资料定量化。 例如总体分成:抽烟与不抽烟两类。0 表示抽烟者; 1 表示不抽烟者。

2.样本

从总体中取出一个个体,称为从总体中得到一个样本。

由于各种原因与实际条件的限制,不可能得到一个总体中所有个体的数据。即样本总是总体的一小部分。统计学的目的就是从样本去得出总体的信息。

二. 数理统计学的主要内容

1. 抽样理论:介绍如何收集数据。主要抽样方法,样本容量的确定,抽样误差,敏感问题等

2. 参数估计:如何根据数据得到总体参数信息。点估计、区间估计,Bayes 估计等

3. 假设检验: 如何对关于总体的一些假设做出决策。正态总体参数的检验,分布拟合检验,秩检验,列联表,统计决策等理论。

4. 方差分析与回归分析:变量间效应关系。 方差分析— 分类变量与数值变量的效应关系。 回归分析— 研究数值变量之间的效应关系。

5. 多元分析: 研究若干个变量之间的关系。

聚类分析、判别分析、主成分分析、因子分析、典型相关分析等等。

三. 统计数据的直观描述:图与表 为数据作图有两个目的:

(1)帮助研究者从数据中提取信息, (2)很方便把信息传递给其它人。 统计数据的图主要有:

(1)分类变量的饼图与条形图,

(2)数值变量的点图、直方图与散点图。

统计推断statistical inference 根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。它是数理统计学的主要任务,其理论和方法构成数理统计学的主要内容。 统计推断就是利用样本的数据,对总体的数量特征作出具有一定可靠程度的估计和判断。统计推断的基本内容有参数估计和假设检验两方面。概括地来讲,参数估计是指研究一个随机变量,推断它的数量特征和变动模式。而假设检验是检验随机变量的数量特征和变动模式是否符合我们事先所作的假设。参数估计和假设检验的共同特点是它们对总体都不很了解,都是利用部分样本所提供的信息对总体的数量特征作出估计或判断。所以,统计推断的过程必定伴有某种程度的不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。

在数理统计学中,统计推断问题常表述为如下形式:所研究的问题有一个确定的总体,其总体分布未知或部分未知,通过从该总体中抽取的样本(观测数据)作出与未知分布有关的某种结论。例如,某一群人的身高构成一个总体,通常认为身高是服从正态分布的,但不知道这个总体的均值,随机抽部分人,测得身高的值,用这些数据来估计这群人的平均身高,这就是一种统计推断形式,即参数估计。若感兴趣的问题是“平均身高是否超过1.7(米)”,就需要通过样本检验此命题是否成立,这也是一种推断形式,即假设检验。由于统计推断是由部分(样本)推断整体(总体),因此根据样本对总体所作的推断,不可能是完全精确和可靠的,其结论要以概率的形式表达。统计推断的目的,是利用问题的基本假定及包含在观测数据中的信息,作出尽量精确和可靠的结论。

统计推断是从总体中抽取部分样本,通过对抽取部分所得到的带有随机性的数据进行合理的分析,进而对总体作出科学的判断,它是伴随着一定概率的推测,特点是:由样本推断总体,统计推断是数理统计的核心部分,统计推断的基本问题可以分为两大类:一类是参数估计问题;另一类是假设检验问题。

(一) 参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。

参数估计的特点是: (1)无偏性。 (2)一致性。 (3)有效性。 (4)充分性。

参数估计的一般方法是:

(1)矩估计法 用样本矩估计总体矩,如用样本均值估计总体均值。 (2)最小二乘法 为了选出使得模型输出与系统输出yt尽可能接近的参数估计值,可用模型与系统输出的误差的平方和来度量接近程度。使误差平方和最小的参数值即为所求的估计值。

(3)极大似然法 选择参数θ,使已知数据Y在某种意义下最可能出现。某种意义是指似然函数P(Y│θ)最大,这里P(Y│θ)是数据Y的概率分布函数。与最小二乘法不同的是,极大似然法需要已知这个概率分布函数P(Y│θ)。在实践中这是困难的,一般可假设P(Y│θ)是正态分布函数,这时极大似然估计与最小二乘估计相同。

(二)假设检验——根据研究目的对样本所属的总体参数或总体分布提出假设,然后根据样本资料所提供的信息,对该假设做出拒绝与否的结论。

1.假设检验的基本思想

假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。

2、假设检验的基本步骤

第一步:提出检验假设(又称无效假设)和备择假设。

H0:样本与总体或样本与样本间的差异是由抽样误差引起的。 H1:样本与总体或样本与样本间存在本质差异。

预先设定的检验水准为0.05。

第二步:选定统计方法,计算出统计量的大小。根据资料的类型和特点,可分别选用t检验,u检验,秩和检验和卡方检验等。 第三步:根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P值小于预先设定的检验水准,则H0成立的可能性小,即拒绝H0,若P值不小于预先设定的检验水准,则H0成立的可能性还不小,还不能拒绝H0。P值的大小一般可通过查阅相应的界值表得到。

3、进行假设检验应注意的问题

(1)做假设检验之前,应注意资料本身是否有可比性。

(2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。 (3)根据资料类型和特点选用正确的假设检验方法。 (4)根据专业及经验确定是选用单侧检验还是双侧检验。

(5)当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。

(6)判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。 (7)报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。

SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Solutions Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。

SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。

SPSS输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS软件的缺陷。

SPSS for Windows是一个组合式软件包,它集数据整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。最新的12.0版采用DAA

(Distributed Analysis Architechture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,依靠于诸多竞争对手。但是它很难与一般办公软件如Office或是WPS2000直接兼容,在撰写调查报告时往往要用电子表格软件及专业制图软件来重新绘制相关图表,已经遭到诸多统计学人士的批评;而且SPSS作为三大综合性统计软件之一,其统计分析功能与另外两个软件即SAS和BMDP相比仍有一定欠缺。

虽然如此,SPSS for Windows由于其操作简单,已经在我国的社会科学、

自然科学的各个领域发挥了巨大作用。该软件还可以应用于经济学、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。

spss简介(2)

SPSS简介09经信管04谭国平统计学(Statistics)是一门收集与分析数据,并且根据数据进行推断的艺术与科学。统计学理论主要包含三个部分:1.数据收集,2.数据分析,3.由数据做出决策。一.统计学的基本概念统计学中把所研究的对象全
推荐度:
点击下载文档文档为doc格式
7wa288dite4g4gh0kzl91od1e2lmz900xvf
领取福利

微信扫码领取福利

微信扫码分享