因子分析法
1. 因子分析(Factor Analysis)
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系, 密切的几个变量归在同一类中, 每一类变量就成为一个因子 可观测的,即不是具体的变量)
术,我们可以方便地找岀影响消费者购买、
即将相关比较
(之所以称其为因子,是因为它是不
以及它们的影响
,以较少的几个因子反映原资料的大部分信息。运用这种研究技
消费以及满意度的主要因素是哪些,
力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。
因子分析法与其他一些多元统计方法的区别:
2?主成分分析
主成分分析主要是作为一种探索性的技术,
在分析者进行多元数据分析之前,
用主成分分析
a,
来分析数据,让自己对数据有一个大致的了解是非常重要的。 主成分分析一般很少单独使用:
了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用, 比如当变量很多, 个案数不多,直接使用判别分析可能无解,
这时候可以使用主成份发对变量简
化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条 件指数),还可以用来处理共线性。
1、 因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个 变量的线性组合。
2、 主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间 的协方差。 3、 主成分分析中不需要有假设 (assumpti on s),因子分析则需要一些假设。因子分析的假设 包括:各个共同因子之间不相关,特殊因子( 间也不相关。
4、 主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一 般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
5、 在因子分析中,因子个数需要分析者指定(
spss根据一定的条件自动设定,只要是特征 specific factor)之间也不相关,共同因子和特殊 因子之
值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量 是一定的,一般有几个变量就有几个主成分。 术帮助解释因子,在解释方面更加有优势。 行解释的时候,更加倾向于使用因子分析,
和主成分分析相比, 由于因子分析可以使用旋转技 大致说来,当需要寻找潜在的因子, 并对这些因子进 并且借助旋转技术帮助更好解释。
而如果想把现有的
变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可
以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。
总得来说,主成分分析主要是作为一种探索性的技术,
在分析者进行多元数据分析之前,
用
主成分分析来分析数据, 让自己对数据有一个大致的了解是非常重要的。 主成分分析一般很少单
独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析 一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,
这时候可以使用主成份
发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在 共线性(条件指数),还可以用来处理共线性。
在算法上,主成分分析和因子分析很类似, 不过,在因子分析中所采用的协方差矩阵的对角
。
元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)
3. 聚类分析(Cluster Analysis)
聚类分析是直接比较各事物之间的性质, 同的类的分析技术。
将性质相近的归为一类,将性质差别较大的归入不
在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体, 我们可以划分岀产品的细分市场,
并且可以描述岀各细分市场的人群特征,
运用这项研究技术, 以便于客户可以有针
对性的对目标消费群体施加影响,合理地开展工作。
4. 判别分析(Discriminatory Analysis) 判别分析(Discriminatory Analysis)
的任务是根据已掌握的
1批分类明确的样品,建立较好的
判别函数,使产生错判的事例最少,进而对给定的 1个新样品,判断它来自哪个总体。根据资
料的性质,分为定性资料的判别分析和定量资料的判别分析;采用不同的判别准则,又有费歇、 贝叶斯、距离等判别方法。
费歇(FISHER )判别思想是投影,使多维问题简化为一维问题来处理。选择一个适当的投 影轴,使所有的样品点都投影到这个轴上得到一个投影值。
对这个投影轴的方向的要求是:
使每
一类内的投影值所形成的类内离差尽可能小,而不同类间的投影值所形成的类间离差尽可能大。 贝叶斯(BAYES )判别思想是根据先验概率求岀后验概率,并依据后验概率分布作岀统计推断。 所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度;
所谓后验概率,就是
根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果。
距离判别思想是根据各样品与各母体之间的距离远近作出判别。 的距离判别函数式, 将各样品数据逐一代入计算, 于距离值最小的那个母体。
5. 对应分析(Correspondence Analysis)
对应分析是一种用来研究变量与变量之间联系紧密程度的研究技术。 运用这种研究技术, 我们可以获取有关消费者对产品品牌定位方面的图形, 调整营销策略,以便使产品品牌在消费者中能树立起正确的形象。
这种研究技术还可以用于检验广告或市场推广活动的效果,
我们可以通过对比广告播岀前或
从而帮助您及时
即根据资料建立关于各母体
判样品属
得出各样品与各母体之间的距离值,
市场推广活动前与广告播岀后或市场推广活动后消费者对产品的不同认知图来看岀广告或市场 推广活动是否成功的向消费者传达了需要传达的信息。
6. 典型相关分析
典型相关分析是分析两组随机变量间线性密切程度的统计方法, 拓广。各组随机变量中既可有定量随机变量,也可有定性随机变量 量)。本法还可以用于分析高维列联表各边际变量的线性关系。
1 ?严格地说,一个典型相关系数描述的只是一对典型变量之间的相关,而不是两个变量组 之间的相关。而各对典型变量之间构成的多维典型相关才共同揭示了两个观测变量组之间的相关 形式。
2 ?典型相关模型的基本假设和数据要求
要求两组变量之间为线性关系,即每对典型变量之间为线性关系;
每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化: 如经济水平和收入水平与其他一些社会发展水之间并不是线性关系, 平,log收入水平。
可先取对数。即log经济水 是两变量间线性相关分析的
(分析时须F6说明为定性变
3 ?典型相关模型的基本假设和数据要求