D 2 及格 proc cluster data=wg outtree=tree method=ward ccc pseudo print=15; var a1-a59; id number; run; proc tree data=tree out=new nclusters=5 graphics; copy a1-a59; id number; run; proc stepdisc data=new; class cluster; run; proc discrim data=new outstat=newstat method=normal pool=yes list crossvalidate; class cluster; priors proportional; var a1-a59; 附录四:第二小题,优化后的数据运行程序 proc cluster data=nwg outtree=tree method=ward ccc pseudo print=15; var b1-b24; id number; run; proc tree data=tree out=new nclusters=5 graphics; copy b1-b24; id number; run; proc stepdisc data=new; class cluster; run; proc discrim data=new outstat=newstat method=normal pool=yes list crossvalidate; class cluster; priors proportional; var b1-b24; run; 附录五:原判别分析表
附录六:优化后的判别分析表
在表中的各列数据代表的意思是:”NCL”为分类数量,表示新类别形成后类别的总数。 “--Clusters Joined---”为合并的类别,指明这一步合并了哪两个类,有两列。其中OBx表示某一个原始样品,而CLx表示在某一个聚类水平上产生的类。 “FREQ”表示这次合并得到的类有多少个样品。 “SPRSQ”是半偏,“RSQ”是,”CCC”是考察聚类效果的统计量,该值越大,聚类水平越好,”PSF”为伪F统计量,“PST2”为伪统计量,“Tie”指示距离最小的候选类对是否有多对,本例全无。