龙源期刊网 http://www.qikan.com.cn
对数据分布特征测度的分析
作者:陈龙禹
来源:《北方经贸》2014年第08期
摘要:统计数据经过整理和显示后,我们对数据分布的类型和特点就有了一个大致的了解,但这种了解只是表面上的,还缺少代表性的数量特征值准确地描述出统计数据的分布。对统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势;二是分布的离散程度;三是分布的偏态和测度。这三个方面分别反映了数据分布的测度特征。 关键词:数据分布;特征测度;分析 中图分类号:F270 文献标识码:A 文章编号:1005-913X(2014)08-0192-01 一、集中趋势的测度 (一)分类数据:众数
众数主要用于测度分类数据的集中趋势,同时也适用于顺序数据以及数值型数据集中趋势的测度位。需注意的是,只有当数据较多,具有明显集中趋势时,计算众数才有意义,才可以利用它来作为某种决策的参考依据。如纺织企业职工“性别”中“女性”人数最多,则“女性”为众数。再如鞋厂在制定各种尺码鞋子的生产计划时,市场上销量最多的型号是众数,也是生产厂家或经销商应该重点生产和销售的型号。 (二)数值型数据:平均数
平均数用于反映所有数值型数据的一段水平。根据计算方法的不同,有算术平均数和几何平均数之分。平均数表明所有变量值的集中趋势,受极端值的影响,它是集中趋势的最主要测度值,主要用于数值型数据集中趋势的测度。 (三)众数、中位数和平均数的比较 1.众数、中位数和均值的关系
从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。因此,对同一组数据计算众数、中位数和均值,三者之间具有以下关系:在单蜂分布条件下,如果数据的分布是对称的,则众数、中位数和均值必定相等,即众数=中位数=均值;如果数据是左偏分布,说明数据存在极小值,必然拉动均值