.
互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表见(例3);如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。这种差值用一个卡方
统计量来表示;对卡方值进行检
验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。
要注意的是,卡方检验受样本量的影响很大,同样两个变量,不同的样本量,可能得出不同的结论。解决这个问题的办法是对卡方值进行修正,最常用的是列联系数。对较大样本,当卡方检验的的结果显著,并且列联系数也显著时(列联系数至少超过0.16),才可拒绝原假设;当卡方检验的结果显著,列联系数不显著时,不能轻易下结论。
另外,对变量取值的不同分类会引起卡方值的改变,有可能得到不同的结论。所以在分类时不能随意,要有理论或统计上的依据。特别是对定距或定序变量,要先将变量的取值分组归类,才能使用卡方分析,而且由于分组的方法不同,也会得出不同的结论;同时,对于定距或定序变量用卡方分析,没有充分利用它们的数量信息。这都是
.
.
在使用卡方分析时要注意的问题。
例3:在《A品牌宣传认知情况调查》中有几个关于对广告的看法和态度的问题,其中一题是” “家电广告应当比较严谨,因为这样的方式更适合于表现家电的性能”,备选答案有“1-非常不同意”、“2-不同意”、“3-一般”、“4-同意”、“5-非常不同意”5种选择。要研究对这个问题的看法与年龄有没有关系,可以使用卡方分析的方法。
其中年龄的变量名是NND2,其取值1代表16~29岁,2代表30~39岁,3代表40~49岁,4代表50~60岁;前面所说题目的变量名是B106,为避免列联表中空格过多,在做卡方分析之前用SPSS中的Recode命令将B106的取值做变换,将“非常不同意”和“不同意”两个变量合并,用1代表,“一般”用2 代表,“同意”和“非常同意”用3代表。表16-3是用SPSS的Crosstables命令得出的两变量的卡方分析结果。
.
市场调查中常用的数据分析方法和手段



