数理统计大作业(二)
全国各省、直辖市经济类型
聚类和判别分析
指导老师: 冯伟
院系名称:航空科学与工程学院 学 号: 姓 名:
2014年12月25日
摘要
本文利用SPSS统计软件,选取了7个主要经济指标,利用聚类分析方法对我国26个省、直辖市的经济类型进行了分类,结果表明可以分为三类,并根据各省市当前的发展情况和经济水平对分类结果进行了评价分析,得出该分类结果是合理的。并采用判别分析的方法对剩下的5个省的经济类型进行了判别分类,结果表明各如分类正确率为100%,证明了分类结果的合理性。 关键词:聚类分析,系统聚类,判别分析,Fisher判别
目录
1 引言.................................................................................................................... 1 2 聚类分析............................................................................................................ 1
2.1 基本概念................................................................................................. 1 2.2 数据采集和整理..................................................................................... 2 2.3 聚类分析过程......................................................................................... 3 2.4 结果分析................................................................................................. 5 3 判别分析............................................................................................................ 6
3.1 基本概念................................................................................................. 6 3.2 判别分析过程......................................................................................... 6 3.3 结果分析................................................................................................. 8 4结论..................................................................................................................... 8 5 参考文献............................................................................................................ 8
1 引言
进入21世纪后,中国经济迅速发展,财政收入、国内生产总值(GDP)等稳步增长,世界排名也名列前茅。2013年,我国GDP以90386.6亿美元的总量超过日本,仅次于美国。随着经济的快速发展,中国城市化进程的脚步也在不断加快。2012年8月国家统计局发布报告显示,十六大以来中国城市化水平进一步提高,城镇化率达51.27%,超过一半的人口已经居住在城镇中。
但是中国国土面积辽阔,各地区的地理位置、自然环境、资源分布、人口构成、开发程度等都存在较大的差异,因此各地区的经济发展状况也存在不同程度的差异,依照各省、市、区经济社会发展水平,可把全国大致分成东部、中部、西部三个经济地带。而这只是一个在较大区域内大划分,没有对各省市的经济水平做出更进一步的划分。显然研究各省市的经济水平差异,对于政府合理引导资源向薄弱省市适当倾斜具有一定的指导作用,对于国家制定总体发展计划也有一定的帮助。
考虑到各省市在各方面都存在较大的差异,评价各省市经济水平的指标要选择的合理,既要考察总量,也要将人均水平纳入考核中。从这方面考虑,从《国
[1]家统计年鉴2013》上选取了我国26个省和直辖市2012年的7个经济数据来进
行评价分类,即城乡居民储蓄存款、地区生产总值、居民消费水平、人均地区生产总值、农村居民纯收入、城镇居民年平均收入和公共财政预算收入。利用SPSS统计软件进行聚类分析,并对聚类结果进行判别分析来判断聚类分析结果的合理性和正确性。 2 聚类分析 2.1 基本概念
聚类分析是研究对象的特征来对研究对象进行分类的多元分析技术的总称,分类问题在科学研究、生产实践、社会生活中到处可见。人们可以靠相关经验和专业知识对事物实现分类,但当反映事物的性质、特性的指标较多,且对分类要求较高时,仅凭经验和专业知识就不能达到确切的分类目的,于是数学方法就被引进到分类问题中来。
聚类分析的核心思想是,从一批样本的多个观测指标变量中,定义能度量样品间相似程度的统计量,在次基础上求出各样品之间的相似程度度量值,按相似
1
程度的大小,将样品逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样品都聚集完毕,把不同的类型一一划分出来,形成一个亲疏关系谱系图,用以更直接的显示分类对象的差异和联系。聚类分析方法较多,本文采用的是系统聚类分析方法,它是目前最流行的方法。 2.2 数据采集和整理
从《中国统计年鉴2013》中选取了2012年全国26个省和直辖市的7个经济数据,整理成表格,如下所示。
表1 各省、直辖市经济数据
城乡居民
储蓄存款 (元)
北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 上 海 江 苏 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东 广 西 海 南 重 庆 贵 州 云 南
21644.90 7055.40 20665.10 11997.00 6597.20 17785.90 6875.10 19506.70 30057.20 11178.60 10507.40 8471.90 26343.30 17469.00 13419.70 12578.30 45533.80 7900.80 2172.70 8361.60 4806.10 7744.70
地区生产总值 (亿元)
居民消费水平 (元)
人均地区生产总值 (元)
农村居民纯收入 (元) 16475.74 14025.54 8081.39 6356.63 7611.31 9383.72 8598.17 17803.68 12201.95 7160.46 9967.17 7829.43 9446.54 7524.94 7851.71 7440.17 10542.84 6007.55 7408.00 7383.27 4753.00 5416.54
城镇居民年平均收入 (元) 41103.11 32944.01 21899.42 22100.31 24790.79 25915.72 21659.64 44754.50 32519.10 23524.56 30877.92 21150.24 28005.61 21897.23 22903.85 22804.55 34044.38 23209.41 22809.87 24810.98 20042.88 23000.43
公共财政收入 (亿元) 3314.93 1760.02 2084.28 1516.38 1552.75 3105.38 1041.25 3743.71 5860.69 1792.72 1776.17 1371.99 4059.43 2040.33 1823.05 1782.16 6229.18 1166.06 409.44 1703.49 1014.05 1338.15
17879.40 30349.52 87475.00 12893.88 22983.95 93173.00 26575.01 10749.42 36584.00 12112.83 10828.99 33628.00 15880.58 15195.51 63886.00 24846.43 17998.75 56649.00 11939.24 12276.26 43415.00 20241.72 36892.86 85373.00 54058.22 19452.26 68347.00 17212.05 10977.73 28792.00 19701.78 16143.87 52763.00 12948.88 10572.93 28800.00 50013.24 15094.99 51768.00 29599.31 10380.34 31499.00 22250.45 12283.00 38572.00 22154.23 11739.53 33480.00 57067.92 21823.28 54095.00 13035.10 10519.48 27952.00 2855.54
10634.49 32377.00
11409.60 13655.44 38914.00 6852.20
8371.96
19710.00 22195.00
10309.47 9781.55
2