一、实验目的及要求:
1、目的
用SPSS软件实现聚类分析及其应用。 2、内容及要求
用SPSS对实验数据运用系统聚类法和K均值聚类法进行分析。
二、仪器用具:
仪器名称 计算机 SPSS软件 规格/型号 数量 1 1 备注 有网络环境 三、实验方法与步骤:
准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中。
分析:由于本实验中要对31个个案进行分类,数量比较大,用系统聚类法当然也可以得出结果,但是相比之下在数据量较大时,K均值聚类法更快速高效,而且准确性更高,因此,在以下的分析过程中,先采用系统聚类法分析,得出相应结果和碎石图(即聚合系数随分类数变化的曲线图),根据碎石图来判定分几类比较合适,然后再用K均值聚类法进行聚类分析得出结果,比较两结果的异同,以得到比较可信的结果。
四、实验结果与数据处理:
1)用系统聚类法对所有个案进行聚类:
采用Z分数对数据进行标准化处理。
以下图一为聚类方法为“组间联接”时的冰柱图,图二为聚类方法为“Ward法”时的冰柱图,图三为聚类方法为“质心聚类法”时的冰柱图。
不难看出在分五类的情况下,(未标出的所有为一类)
图一的分类为:北京;天津;上海、浙江、广东;辽宁、四川、江苏、山东;…… 图二的分类为:北京;天津;上海、海南、浙江、广东;辽宁、四川、江苏、山东;……图三的分类为:北京;天津;上海、浙江、广东;辽宁、四川、江苏、山东;……
聚类方法为“组间联接”与“质心聚类法”时分五类的情况是一样的,而聚类方法为“Ward法”时与它们两个有些许差别,但总的来说在分五类时,比较可信的结论是北京、天津单独为一类,辽宁、四川、江苏、山东为一类,上海、浙江、广东为一类,在海南省的划分上有些差异,“Ward法”中将其与上海、浙江、广东分为一类,但是其余两个将海南与未列出各省划为一类。
图一
图二