好文档 - 专业文书写作范文服务资料分享网站

聚类分析(快速聚类和变量聚类) 上机指导

天下 分享 时间: 加入收藏 我要投稿 点赞

.

实验六 聚类分析

——动态聚类和变量聚类

二、动态聚类法——FASTCLUS过程

动态聚类又称为逐步聚类,基本思想是,开始先粗略地分一下类(先选一批凝聚点,让样品向最近的凝聚点聚集,就得到初始分类),然后按照某种最优的原则修改不合理的分类,直到分得比较合理为止。

FASTCLUS过程的一般格式:

PROC FASTCLUS MAXCLUSTER=n|RADIUS=t ; VAR variables; ID variable; FREQ variable; WEIGHT variable; BY variables; 语句说明:

PROC FASTCLUS 语句用来开始FASTCLUS过程,必须规定说明项MAXCLUSTER= 或RADIUS= 中的一个。 说明项和常用选项:

(1) MAXCLUSTER=n|MAXC=n :指定所允许的最大分类数,

缺省为100.

(2) RADIUS=t :为选择新的“凝聚点”指定的最小距离

精品

.

准则。当一个观测点与已有

精品

.

“凝聚点”的最小距离均大于由该选项规定的值t时,该观测可考虑用来作为新的“凝聚点”。t的缺省值为0.

(3) DATA=SAS-data-set:给出进行聚类的观测数据集的

名字。

(4) OUT= SAS-data-set:聚类结果保存都新的数据集中,

包含VAR中变量,及新变量cluster和distance(观测与所属类间的距离)。

(5) CLUSTER=name: 规定在输出的数据集中用以指示观

测属于哪一类的变量名字。缺省为CLUSTER.

(6) DRIFT:执行逐个修改法

(7) MAXITER=n:指定重新计算类的凝聚点的最大迭代次

数。当n>0时,执行按批修改法。缺省为1.

(8) DISTANCE:要求输出类均值之间的距离

(9) LIST:要求列出所有观测所归入类的类号及观测同

最终凝聚点之间的距离。

注意事项:

应用举例:

例2:试用FASTCLUS过程对16个地区农民生活水平的调查数

精品

.

精品

.

(数据集d641)进行分类。 SAS程序:

proc fastclus data=d641 out=out653 maxc=4 list; var x1-x6;id group; run;

maxc=4:规定最大分类个数为4类 list:要求列出分类结果。

out=out653:指定生成名为out653的输出数据集,包含VAR中的变量,新变量cluster和新变量distance(观测与所属类中心的距离)。

主要输出结果:

动态聚类的初始凝聚点(数据不标准化)

动态聚类的分类结果(数据不标准化)

精品

聚类分析(快速聚类和变量聚类) 上机指导

.实验六聚类分析——动态聚类和变量聚类二、动态聚类法——FASTCLUS过程动态聚类又称为逐步聚类,基本思想是,开始先粗略地分一下类(先选一批凝聚点,让样品向最近的凝聚点聚集,就得到初始分类),然后按照某种最优的原则修改不合理的分类,直到分得比较合理
推荐度:
点击下载文档文档为doc格式
6wk629s3dd2nsft0iuth97tl37kv1k00rd4
领取福利

微信扫码领取福利

微信扫码分享