好文档 - 专业文书写作范文服务资料分享网站

聚类分析方法

天下 分享 时间: 加入收藏 我要投稿 点赞

聚类分析方法

俗话说,物以类聚,聚类分析(cluster analysis)就是通过观测数据将对象进行分类的统计方法。聚类分析的主要思想就是相近(或相似)的样品(或指标)归为一类,该方法最早是由考古学家在对考古分类中研究中发展起来的,如今已经被广泛的应用在天气、地质、生物、金融、保险、图像处理等许多领域。在食品安全领域,可以通过食品污染物数据对地域进行分类或拓展到更多方面。

聚类方法有很多,不过大致可分为两类:系统聚类(hierachical clustering)方法和动态聚类(dynamic clustering)方法,系统聚类方法中最常用的是层次聚类,动态聚类中最常用的是K-均值聚类。

1层次聚类法

层次聚类方法对给定的数据集进行层次的分解,直到某种条件满足为止。具体又可分为凝聚的,分解的两种方案。

层次聚类法中凝聚法就是先将n个样本各自看成一类,然后规定样品之间的距离和类与类之间的距离,将距离最小的一对并成一个新类,然后,计算新类和其他类的距离,再将距离最近的两类合并,这样每次减少一类,直到所有的样品都成一类为止。

凝聚法是类由多到少的方法,而分解法是类由少到多的算法,是先将所有的样品看成一类,然后将所有的样品分成两类,使得两类之间的样品尽量的远,接着再将各小类继续分类,直到所有的样品各成一类为止。

不管是凝聚法还是分解法,最终都是将根据各类之间的亲疏关系,逐步画成一张完整的分类系统图,即谱系图或树状聚类图。

类间距离等于两类对象之间的最小距离,根据经验,由离差平方和法所得的谱系聚类图的凝聚聚类方法最为清晰。整个过程就是建立一个树结构,类似于下图。

聚类分析方法

聚类分析方法俗话说,物以类聚,聚类分析(clusteranalysis)就是通过观测数据将对象进行分类的统计方法。聚类分析的主要思想就是相近(或相似)的样品(或指标)归为一类,该方法最早是由考古学家在对考古分类中研究中发展起来的,如今已经被广泛的应用在天气、地质、生物、金融、保险、图像处理等许多领域。在食品安全领域,可以通过食品污染物数据对地域进行分类或拓展到更多方面。<
推荐度:
点击下载文档文档为doc格式
5wr365clbc77t6k14pg60zn011onzd01af6
领取福利

微信扫码领取福利

微信扫码分享