1、因子分析法(Factor Analysis)
一、方法介绍
基本思路:
因子分析法是一种多元统计方法,它从研究相关矩阵内部的依赖关系出发,根据相关性大小把变量分组(使得同组内的变量之间相关性不高,而不同组内的变量之间相关性较低),这样,在尽量减少信息丢失的前提下,从众多指标中提取出少量的不相关指标,然后再根据方差贡献率确定权重,进而计算出综合得分的一种方法。
理论模型:
设m个可能存在相关关系的测试变量z1,z2,……,zm含有P个独立的公共因子F1,F2,……,Fp(m≥p),测试变量zi含有独特因子Ui(i=1…m),诸Ui间互不相关,且与Fj(j=1…p)也互不相关,每个zi可由P个公共因子和自身对应的独特因子Ui线性表出:
?Z1?a11F1?a12F2???a1pFp?c1U1??Z2?a12F1?a22F2???a2pFp?c2U2 (1) ??????????????????Zm?am1F1?am2F2???ampFp?cmUm?用矩阵表示:
?F1??c1U1??Z1????????F??cU??Z?2???(a).?2???22?
ijm?p?????????????????????FZcU?m??p??mm?简记为
(m?1)Z?A*F?C(m?p)(p?1)(m?m)(m?1)(对角阵)U (2)
且满足:(I) P≤m;
(II) COV(F.U)=0 (即F与U是不相关的); (III) E(F)=0 COV(F)= (1?1)p?p?Ip。
即F1,……FP不相关,且方差皆为1,均值皆为0
(IV) E(U)=0 COV(U)=Im 即U1,……,Um不相关,且都是标准化的变量,假定z1,……,zm也是标准化的,但并不相互独立。
式中A称为因子负荷矩阵,其元素(即(7.2-1)中各方程的系数)aij表示第i个变量(zi)在第j个公共因子Fj上的负荷,简称因子负荷,如果把zi看成P维因子空间的一个向量,则aij表示zi在坐标轴Fj上的投影。
因子分析的目的就是通过模型(1)或(2),以F代Z,由于一般有P<m,从而达到简化变量维数的愿望。
二、使用软件和软件实现过程
采用Eviews5.1、SPSS12.0、Stata5.1、SAS Release8.02 等计量软件均可完成上述因子分子模型,建议采用SPSS12.0操作。
因子分析的基本步骤如下(事物可观测原始变量为x1,x2,……,xp):
(1)对原始变量标准化。在因子分析求解时若采用主成分法,由于主成分分析在通过总体协方阵求主成分时,往往优先顾及方差较大的变量,受变量的计量单位影响较大,有时会造成不合理的结果,所以为了消除这种影响,需在分析之前,对原始变量标准化。标准化最常规的方法是将原变量数列化为均值为0、方差为1的数列,即令
zx?x?E(x); D(x) (2)求出标淮化数据zx1, zx2,……,zxp的协方差矩阵,或相关系数矩阵R(两者等价);
(3)求R的特征值及相应的一组正交单位特征向量; (4)计算累计贡献率,确定公共因子个数及因子载荷矩阵A;
(5)对A作因子旋转(常为方差最大正交旋转),使得能对公共因子给出合理的解释;
(6)计算因子得分,根据得分对研究问题作比较分析。 上述计算步骤及作图可利用SPSS11.0软件来完成:
(1)选择菜单中“Analyze->descriptive statistics->desctrptives...\,对x l, x2,…,xp指标进行标准化处理,并将标准化后的变量保存在数据编辑窗口;
(2)选择菜单中“Analyze->data reduction-factor\,打开因子分析对话框,将标准化后的变量放人Variables中,进行主成分分析;
(3)在主成分分析的基础上进行观察,发现提取几个公共因子较佳,在“factor->extract->numbers of facto\中输人公共因子的个数;
(4)在“factor-rotation”中选择varimax,对因子进行方差最大旋转; (5)在“factor-score”中选regression,计算因子得分。
三、一个简单例证:重庆城镇居民消费结构变动的因子分析
本文运用数理统计中的因子分析法,对重庆直辖后城镇居民消费结构的变动
情况进行分析,认为居民消费主要受生存型消费和享受型消费两大因子的影响,分析表明这两型因子所占比重近几年来都稳定在8:2 的水平上,并未发生大的变化。
1、资料来源
消费结构是人们在生活中消费的消费资料和接受的服务种类及其比例关系,也就是指各类消费支出在总消费支出中的比重。对居民消费支出按照人们实际支出的去向分类可分为食品、衣着、家庭设备及服务、医疗保健、交通通讯、文教娱乐及服务、居住、杂项商品及服务。分别记为X1 , X2 ,…… , X8。根据重庆市统计年鉴1998~2003 年各卷,得重庆市城镇居民消费结构变化如表1 所示。由表1 中资料可知,食品、衣着所占比重从1998 年开始是下降的。联合国 提出的恩格尔系数(食品在总消费支出中的比重) 判定生活发展阶段的一般标准:60%以上为贫困, 50%~60%为温饱,40%~50%为小康,40%以下为富裕,可见重庆城镇居民消费水平已从小康迈向了富裕。家庭设备所占比重也是下降的,这说明居民对一般家庭设备的需求已经基本饱和,且由于总收入的增加,杂