地理建模原理实验报告
集团标准化小组:[VVOPPT-JOPP28-JPPTL98-LOPPNN]
地理建模原理实验报告
学 号:
姓 名: 高义丰 班 级: 1223102 专 业:指导老师: 地理信息系统 陵南燕
2015年6月27日
目录
一、实习项目
1. 学习SPSS软件,学会如何该软件进行因子分析与回归分析(课堂); 2. 学习SPSS软件,学会如何该软件随机时序分析(课堂); 3. 利用SPSS软件,完成数据文件里的一系列操作。
二、实习目的
在实习后根据老师讲解的内容能够对spss软件有所了解并能够掌握如何用统计软件进行相关分析、因子分析和回归分析等用实习数据完成此类实习操作,相关分析与回归分析有相关系数、相关分析与偏相关分析、距离分析。
三、实习内容
1、简单相关分析
在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能的出错误结论。
输入数据后,依次单击Graphs—Scatterplot
散点图
确定两个变量间是否存在相关趋势,该趋势是否为直线趋势 Bivariate相关分析的步骤:
(1)输入数据后,依次单击Analyze—Correlate—Bivariate,打开Bivariate Correlations对话框。
如图打开双变量相关后在点选项就会得到结果图右边结果,如图设置即可得到结果 结果分析:
描述性统计量表,如下:
从表中可看出, Pearson相关系数为0.865,即小鸡的体重与鸡冠的相关系数为0.865,显着性水平是0.01,这两者之间不相关的双尾检验值为0.001。从统计结果可得到,小鸡的体重与鸡冠重之间存在正相关关系,当小鸡的体重越大时,则小鸡的鸡冠越重。并且,否定了小鸡的体重与鸡冠重之间不相关的假设。
2、偏相关
当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。偏相关系数是用来衡量任何两个变量之间的关系的大小。
选择Analyze—Correlate—Partial打开偏相关,如下:
在统计学中,自由度(DF)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本含量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。
结果分析:在固定变量x2下Y与x1的偏相关系数为0.9483在a=0.001下线性关系显着。
3、距离过程
距离相关分析是:对观测量之间或变量之间相似或不相似的程度的一种测量,可用于同一变量内部各个取值间,以考察其相互接近程度;也可以用于变量间,以考察预测测值对实际值的拟合优度。
距离相关分析的结果给出的是个变量或记录之间的距离大小,以供用户自行判断相似性。 选择Analyze—Correlate—Distances 距离分析 设置如图所示点击确定就可以达到结果:
Proximity Matrix
Correlation between Vectors of Values h1 h2 h3 h1 1.000 .573 .731 h2 .573 1.000 .088 h3 .731 .088 1.000 This is a similarity matrix 三次测量结果的相关系数矩阵。第一次测量与第二次测量结果的r = 0.573,第一次测量与第三次测量结果的r = 0.731,第二次测量与第三次测量结果的r = 0.088,由此可见,后两次测量的结果一致性较差,这意味着第一次恰好是后两次的“均值”,故对该指标作重复测量意义不大。
4、因子分析
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与聚类分析不同),以较少的几个因子反映原资料的大部分信息。
选择[Analyze]=>[Data Reduction]=>[Factor],显示的[Factor Analysis] 结果分析:
共同度(公共因子方差),共同度越大表示Xi对因子的共同依赖程度越大,因子描述变量越有效。
两个因子对所有变量的共同度都很大,在0.880 到0.988 之间。
从结果可以看出五个变量在第一个因子上都具有大的正负荷,尤其是X4 的负荷特别大。在第二个因子上变量X1 和X3 都有较大的正负荷,X2和X5 都有较大的负荷,X1、X3 和X2、X5 形成了鲜明的对照,而在X4上的负荷非常小。
因子得分:对公共因子的取值进行估计,计算各个样本的公共因子得分。在公共因子的空间中,按照各个样本的因子得分值标出其对应的位置。 结果如下图所示:
5、回归分析
如果在研究变量之间的相关关系时,把其中的一些因素作为所控制的变量(自变量),而另一些随机变量作为它们的因变量,这种关系分析就称为回归分析。
(1)一元线性回归
选择主菜单[Analyze]=>[Regression]=>[Linear]打开线性回归 因变量为y,自变量为x,得到下列参数分析表: 拟合优度检验:
样本观察值聚集在样本回归直线周围的紧密程度利用判定系数R2来判定R2越大模型拟合度越高
相关系数显着性检验:
两个变量间的线性相关程度,用相关系数R来判别,SXY 称为X 与Y 的样本协方差,SX 称为X 的样本标准差,SY 称为Y 的样本标准差。根据给定的显着性水平α和样本容量n,查相关系数表得到临界值rα。若|r|>rα,则X 与Y 有显着的线性关系,否则X 与Y 的线性相关关系不显着。