基于主成分和聚类分析的中国省域经济发展水平分析
黄 智
【摘 要】根据中国统计年鉴公布的2015年全国31个省市、自治区经济发展数据,选取相应指标反映经济发展状况,并通过SPSS多元统计分析软件的主成分分析与聚类分析方法对我国各省域经济发展水平进行评价。结果表明,目前中国各省域经济发展很不平衡,特别是中西部对比东部地区的差异尤为明显;同时,经济发展速度也快慢不一,个别落后省份经济增长速度相对迟缓;各地区经济发展方向也存在较大差异,内陆省份的外商投资较低、R&D经费投入不足。最后,根据实证结果进行划类分析,提出相应的对策与建议。 【期刊名称】辽宁农业职业技术学院学报 【年(卷),期】2017(019)006 【总页数】5
【关键词】经济发展水平;聚类分析;主成分分析;可持续增长
一、引言
经济发展是一个长久不衰的话题。当前的中国经济已步入“新常态”时期,全国31个省市、自治区的经济发展也面临着不同的机遇与挑战。新常态的“新”在于它的新高度、新深度,这对于我国经济政策的选择与企业的经济转型,以及对各省份产业结构的升级都有着深远影响。新常态经济追求的是高质量和可持续增长的经济,并非传统意义上经济总量的大幅提高,所以要找准中国经济发展的增长点、完成经济结构转型、实现经济机制的稳步发展,摆脱传统经济的“快”,转向新常态经济的“稳”,从而保证中国经济能够维持中高速的可持续增长。
新形势下各省域的经济发展正同现实问题和未来机遇进行挑战,由传统经济增长模式到新常态时期经济发展路径的转变,使得各省份的经济发展都处于一个重要的历史转折期。目前,中国东中西部各省域经济状况的不平衡仍在影响我国整体经济的发展。为研究经济增长的可持续性,文章以多元统计方法中的主成分分析与聚类分析对我国31个省市、自治区在2015年的经济发展状况进行具体分析,以期在新常态下对各省域的经济发展水平进行综合评价。
二、构建评价指标体系
(一)评价方法的选取
在实证研究过程中,研究者往往希望获得更多的信息。因此研究者选择多个观测角度,采用多个变量来衡量事物多方面的特征。较多的变量在给研究者提供丰富信息的同时也导致信息的重叠现象,从而增加了问题分析的复杂性和探求事物本质关系的难度。针对这种情况,国内学者的杨茜[1]在研究我国各省域经济与环境协调发展状况时,采用主成分分析与聚类分析两种方法对我国经济可持续发展进行评价及预测;吕岩威、孙慧、周好杰[2]等学者则通过主成分分析和聚类分析对我国西部12个省市的经济实力进行排序分类,为相关管理部门制定扶持西部发展的方针政策提供参考依据。
根据上述分析,文章采用“主成分分析和聚类分析”的方法对全国31个省市、自治区的经济发展水平进行综合评价。其中:(1)主成分分析利用原始变量的线性生成主成分,通过导出非观测综合变量去描述原始的多个变量之间的相关关系[3];(2)聚类分析则是选择相关的观测指标,通过不同的距离定义实现分组,使组内的数据对象具有高度的相似度[4]。 (二)指标说明与数据处理
1.指标的选取与说明
为有效反映各省域的经济发展状况与水平,以进行全面分析,其综合评价体系必须选取足够的指标。文章选用中国31个省市、自治区2015年国内生产总值GDP的变化情况来反映经济发展水平,对于其他指标变量的定义如下:依次选择居民消费水平、第三产业生产总值,财政收入、固定资产投资、外商投资企业货物进出口总额、R&D经费支出、城乡人均可支配收入和地区生产总值作为我国省域经济发展水平的评价指标。这9个指标涵盖了经济总量、经济效益和经济结构三方面的情况,其中的GDP值、地区生产总值、财政收入和固定资产投资主要反映了该地区的经济规模与经济总量。 2.数据的来源与处理
各个指标的数据均是从2016年发布的《中国统计年鉴》中收集得到。针对数据的预处理有:(1) GDP生产总值换算为人均GDP值;(2)第三产业生产总值换算为第三产业所占比重(第三产业生产总值/GDP生产总值);(3)居民消费水平换算为居民消费水平绝对数;(4)城乡人均可支配收入换算为城乡人均可支配收入比(城镇/农村)。为便于观测指标,在参考相关文献的基础上,最终文章选取9个指标构建如下评价体系,如表1所示。
根据上述选定的指标,汇总2015年全国31个省市、自治区的相应数据并列入评价体系中,得到原始的统计数据。
三、实证研究
(一)主成分分析
文章利用SPSS24.0软件对全国31个省市、自治区进行主成分分析,通过设定累积贡献率来选取主成分,并根据所选主成分的贡献率列出相应的回归方程。