聚类分析在股票投资分
析中的应用
文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]
聚类分析在股票投资分析中的应用
摘要:在证券投资中,投资者必须对股票进行基本面分析以减少投资风险。而当我们进行分析时,会遇到多个指标,且每个指标意义不同,有时很难进行决策,采用聚类分析可以帮助我们解决这一问题。 关键词:聚类分析;统计分析;证券投资
0.引言 中国股市随着经济的迅速发展壮大是有目共睹的,随着中国的股市逐步走向完善,走向规范化,价格及其内在价值回归是未来股市发展的重要方向。股票的档次将不断拉开,成长率高的绩优股会越来越受到投资者的追捧。过去那种高投机、高市盈率、价格严重偏离其价值的现象将逐步纠正。理智的股票投资者,将会更加重视上市公司的经营业绩,重视股票自身的品质,即重视投资对象的选择。运用聚类分析模型能帮助投资者准确地了解和把握股票的总体特征,确定投资范围,并通过类的总体价格水平来预测股票价格的变动趋势,选择有利的投资时机。首先,聚类分析是建立在基础分析之上的,立足于对股票基本层面的量化分析,弥补了基础分析对影响股票价格的因素大多是定性分析的不足。作为理性的长期投资的参考依据,其目的在于从股票基本特征决定的内在价值中发掘股票真正的投资价值。其次,与现代投资组合理论相比,聚类分析法显得直观、实用,而且在应用时所受的局限小,操作性强,有一定的优越性,适合于广大投资者采用。聚类分析建立的是一种长期投资的理念,因此在我国证券市场走向成熟的过程中,提倡运用这种理性的投资分析方法,可以降低投资风险,规范投资行为。
1 聚类分析方法 聚类分析的含义
聚类分析是一种新兴的多元统计方法,是当代分类学与多元分析的结合。聚类分析是将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。通俗的讲,聚类分析就是根据事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。
在实际研究中,既可以对样本个体进行聚类,也可以对研究变量进行聚类,对样本个体进行聚类通常称为Q 型聚类,对研究变量进行的聚类称为R 型聚类。在市场研究中,Q 型聚类常用于市场细分研究,寻找不同目标市场及其构成者特征,R 型聚类可以用于确定产品各属性的同质性。
聚类分析的方法很多,常用的有系统聚类、动态聚类。动态聚类的原理是先对分类事物作一个初始的粗糙的分类,然后在根据某种原则对初始分类进行修改,直至分类被认
为比较合理为止。系统聚类除了要定义事物之间的亲疏程度指标,还要定义类与类之间亲疏程度指标并且要导出求取类间亲疏指标值的递推公式。系统聚类初始,先把所有待分类事物各自看成独立的一类,求出两两之间的亲疏指标值,把关系最为亲密的两类合并成一个新类,然后计算新类与原有各类之间的亲疏指标值,再把其中关系最为密切的两类合并,如此反复进行,直到最终所有待分类事物合并成一个大类为止。最终绘成一幅系统聚类的谱系图,再根据一定的原则确定最终分类结果。 定义距离
设有n 个样品,p 个指标,每个样品都有这p 个指标的观察值,设第i个样品的第j个指标的观察值为xij,把n个样品看成p 维空间中的n个点,则两个样
品间亲疏程度可用P 维空间中两点的距离来度量。令dij表示样品xi与xj的距离。定义距离公式,本文采用明氏距离。
明氏(Minkowski)距离:dij(q)?[?xik?xjk]q
k?1pq1当q=1时,明氏距离变为绝对距离:dij(1)??xik?xjk
k?1p当q=2 时,明氏距离变为欧氏距离:dij(2)?[?xik?xjk]2
k?1n21当q??时,明氏距离变为切比雪夫距离:dij(1)??xik?xjk
k?1p设xij表示第i种股票第j个指标的值。dij表示第i种股票与第j种股票的距离,我们定义距离越近表示两种股票的性质越接近,可以归为一类。 聚类分析步骤
聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照他们在性质上的亲疏程度进行分类。凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和聚类方法可以获得满意的数值分类效果。聚类分析法是把个体逐个的合并成一些子集,直至整个总体都在一个集合之内为止。其分类步骤如下:
聚类前先对数据进行变换处理
聚类分析处理的开始是各样品自成一类(n 个样品一共有n 类),计算各样品之间的距离,并将距离最近的两个样品并成一类。
选择并计算类与类之间的距离,并将距离最近的两类合并,如果类的个数大于1,则继续并类,直至所有样品归为一类为止。
最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。 2. 应用实例
本文选取了江西省35家上市企业去除因停牌等原因2家,选取33家上市企业,根据2014年年度报告中的数据和信息,选取每股收益,每股净资产,净资产收益率,每股资本公积金4项财务指标,采用系统聚类方法对这些公司股票进行了分析,将它们进行分类,为股票的分析和选择提供决策依据。数据见附录,资料来源上市公司中期报告(同花顺)。 指标聚类分析
利用软件,通过计算机的运算,聚类分析结果,将上市公司主要分为三类。 第一类:恒大高新;洪都航空;仁和药业;联创光电;赣能股份;博雅生物;洪城水业;江中药业;九鼎投资;赣粤高速;章源钨业;昌九生化;凤凰光学;新钢股份;富祥股份;正邦科技
第二类:赣锋锂业;华伍股份;中文传媒;三川股份;泰豪科技;万年青;黑猫股份;诚志股份;江西铜业;安源煤业
第三类:世龙实业;三鑫医疗;煌上煌;华意压缩;江西长运;方大特钢;江铃汽车
通过聚类分析我们得到:第一类上市公司经营业绩一般长期投资者很难获利,几乎无投资价值,应该规避这样的公司,但是江西省这样的公司比例最大,数量最多。其中二类每股收益,每股净资产以及净资产收益率较高,说明这类公司经营良好,业绩优良具有较高的投资价值,在资本市场中,机构和基金偏爱这样的投