图17
在Year一栏填入1965,Month一栏填入1,表示数据从1965年1月开始计算。
选择Analyze->Correlate->Bivariate,出现图18
图18
把hstarts,Year和Month都选入Varibales选项,Correlation Coefficients选择Pearson和Spearman(其实只需要选Spearman就可以,这里只是试一下,作为比较)。 注:相关检验中有Pearson(皮尔森)相关系数和Spearman(斯皮尔曼)等级相关,前者也称皮尔森相关系数,是对两个定距变量关系的刻画;后者是用来考察两个变量中至少有一个定序变量时的相关关系。Zero-order Correlations(零阶偏听偏相关系数)是按Pearson简单相关系数公式计算得到的相关系数。在皮尔森系数r是对两个定距变量关系的刻画: 若-1≤r≤1,|r|越大,表明两个变量之间的相关程度越强。
若0 若-1≤r<0,表明两个变量之间存在负相关。若r=-1,则变量间的关系为完全负相关。 若r=0,表示两个变量之间无线性相关,即零相关。 按Option按键,如图19 图19 在Statistics选择Means and standard deviations Cross-product deviations and covariances,注意,这二个选择是Pearson才有的,如果开始只选择Spearman,则此二项不能选。返回后,按OK如图20: 图20 从图20看到Year的Pearson系数为0.219,Sig值为0.012,小于P值0.05,与Hstarts显著相关,Month的Pearson系数为0.058,Sig值为0.506,大于P值0.05,则与Hstarts不显著相关。从下图21的Spearman也同样得到相同的结论。 图21 2.回归 试建立回归模型,看能否形成各变量间的关系式。选择Analyze->Regression->Curve Estimation,出现图22 图22 把hatarts选入Dependents选项,Independent选择Time,Models选择(Linear)线性回归,(Quadratic)二次曲线回归,(Cubic)三次曲线回归,(Exponential)指数回归,选择Include constant in equation表示方程式有常数项,Plot models则表示用图表示,然后按OK,出现图23 图23 线性方程:Y=70.43 0.135X 二次曲线方程:Y=64.171 0.415X-0.02X2 三次曲线方程:Y=87.68-1.667X 0.037X2( 0X3) 指数曲线方程:Y=68.229xe0.002 从Sig值判断,都小于0.05,都接受回归成立,这样,只能从R拟合度和F值较大来判断三次曲线方程的拟合程度比较高。 注意,如果方程成立的话,想要增加预测,则可以在Save选项中选择Predicted Values一项,如果还想预测未来的数值,则可以在原表上增加若干行(如1行),然后选择Predict Cases下面Predict through,在Year填入1976,在Month填入1,这样就表示预测值到1976年的一月。如图24所示。