⒊ 设置Scores设置。
选中Save as variables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归”(Regression)法即可。
图7 因子得分对话框
选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。
设置完成以后,单击Continue按钮完成设置(图7)。
⒋ 其它。
对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。
全部设置完成以后,点击OK确定,SPSS很快给出计算结果(图8)。
图8 主成分分析的结果
第四步,结果解读。
在因子分析结果(Output)中,首先给出的Descriptive Statistics,第一列Mean对应的变量的算术平均值,计算公式为
1nxj??xij
ni?1第二列Std. Deviation对应的是样本标准差,计算公式为
1n?j?[(xij?xj)2]1/2 ?n?1i?1第三列Analysis N对应是样本数目。这一组数据在分析过程中可作参考。
Descriptive Statistics国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值Mean1921.0931745.933511.50835457.633666.1400117.2867114.9067862.9980Std. Deviation1474.80603861.64193402.885481310.21805459.966992.025311.89808584.58726Analysis N3030303030303030 接下来是Correlation Matrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式det(?I?R)?0可知,det(λI)=det(R),从而Determinant=1.133E-0.4=λ1*λ2*λ3*λ4*λ5*λ6*λ7*λ8。这一点在后面将会得到验证。
aCorrelation Matrix国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值国内生产1.000.267.951.191.617-.273-.264.874居民消费.2671.000.426.718-.151-.235-.593.363固定资产.951.4261.000.400.431-.280-.359.792职工工资.191.718.4001.000-.356-.135-.539.104货物周转.617-.151.431-.3561.000-.253.022.659消费价格-.273-.235-.280-.135-.2531.000.763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192工业产值.874.363.792.104.659-.125-.1921.000a. Determinant = 1.133E-04 在Communalities(公因子方差)中,给出了因子载荷阵的初始公因子方差(Initial)和提取公因子方差(Extraction),后面将会看到它们的含义。
Communalities国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值Initial1.0001.0001.0001.0001.0001.0001.0001.000Extraction.945.800.902.875.857.957.929.903 在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues(初始特征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根λ,因此可以直接根据特征根计算每一个主成分的方差百分比(% of Variance)。由于全部特征根的总和等于变量数目,即有m=∑λi=8,故第一个特征根的方差百分比为λ1/m=3.755/8=46.939,第二个特征根的百分比为λ2/m=2.197/8= 27.459,……,其余依此类推。然后可以算出方差累计值(Cumulative %)。在Extraction Sums of Squared Loadings,给出了从左边栏目中提取的三个主成分及有关参数,提取的原则是满足λ>1,这一点我们在图6所示的对话框中进行了限定。
Total Variance ExplainedInitial Eigenvalues% ofCumulativeTotalVariance%3.75546.93946.9392.19727.45974.3981.21515.18689.584.4025.03194.615.2132.66097.275.1381.72498.9996.5E-02.81899.8171.5E-02.183100.000Extraction Sums of Squared Loadings% ofCumulativeTotalVariance%3.75546.93946.9392.19727.45974.3981.21515.18689.584Extraction Method: Principal Component Analysis.Component12345678Extraction Method: Principal Component Analysis. Scree Plot4321Eigenvalue012345678Component Number图8 特征根数值衰减折线图(山麓图)
主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据λ值决定主成分数目的准则有三:
i 只取λ>1的特征根对应的主成分
从Total Variance Explained表中可见,第一、第二和第三个主成分对应的λ值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。
ii 累计百分比达到80%~85%以上的λ值对应的主成分
在Total Variance Explained表可以看出,前三个主成分对应的λ值累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。
iii 根据特征根变化的突变点决定主成分的数量
从特征根分布的折线图(Scree Plot)上可以看到,第4个λ值是一个明显的折点,这暗示选取的主成分数目应有p≤4(图8)。那么,究竟是3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。
在Component Matrix(成分矩阵)中,给出了主成分载荷矩阵,每一列载荷值都显示了各个变量与有关主成分的相关系数。以第一列为例,0.885实际上是