(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 109960716 A(43)申请公布日 2019.07.02
(21)申请号 201910220103.1(22)申请日 2019.03.22
(71)申请人 青岛格兰德信用管理咨询有限公司
地址 266071 山东省青岛市市南区宁夏路
288号4号楼一层103室(72)发明人 不公告发明人
(74)专利代理机构 青岛华慧泽专利代理事务所
(普通合伙) 37247
代理人 李新欣(51)Int.Cl.
G06F 16/29(2019.01)G06Q 10/06(2012.01)G06Q 30/02(2012.01)
权利要求书2页 说明书4页 附图1页
(54)发明名称
分析企业数据与区域经济繁荣度关联性的数据挖掘方法
(57)摘要
本发明属于区域营销的数据挖掘技术领域,具体涉及分析企业数据与区域经济繁荣度关联性的数据挖掘方法,所述方法包括:数据维度的确定、样本数据选择、数据归一化、样本数据标注、支持向量机训练模型、模型部署以及数据可视化步骤;其中,数据维度的确定的步骤确定的数据维度为半径300米内企业注册资本的均值以及半径300米内企业注册资本的总和;根据选择的区域经济繁荣度相关性强的企业维度,建立基于企业数据的区域经济繁荣度的多分类模型,并且能够实现数据可视化,将分类结果用不同颜色在地图上标识出来;便于销售人员掌握区域内企业的分布情况以及了解某一片区域的整体情况。
CN 109960716 ACN 109960716 A
权 利 要 求 书
1/2页
1.分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述方法包括:
数据维度的确定:确定用于计算区域经济繁荣度的数据维度为半径300米内企业注册资本的总和、半径300米内企业数量的总和;
样本数据选择:以城区常住人口为统计口径,将全国所有城市分为5个等级:在每个等级的城市中随机抽样至少100000条数据作为样本数据;
数据归一化:计算样本数据中半径300米内企业注册资本的总和、半径300米内企业数量的总和的均值和方差,进行归一化处理;
样本数据标注:分别计算得出数据归一化步骤中两个归一化指标的0.15分位数、0.3分位数、0.5分位数、0.7分位数、0.85分位数;同时满足两个指标0.15分位数上下浮动0.0002的半径300米的区域标记为5、同时满足两个指标0.3分位数上下浮动0.0002的半径300米的区域标记为4、同时满足两个指标0.5分位数上下浮动0.0002的半径300米的区域标记为3、同时满足两个指标0.7分位数上下浮动0.0002的半径300米的区域标记为2、同时满足两个指标0.85分位数上下浮动0.0002的半径300米的区域标记为1;
支持向量机训练模型:将每个等级的样本数据和所述样本数据标注的标记结果分成两个部分:训练集、测试集;每个等级单独用支持向量机多分类算法训练模型,得出区域经济繁荣度结果;
模型部署:在阿里云服务器上起一个服务,通过http请求,将每个企业半径300米内企业注册资本的总和、半径300米内企业数量的总和作为请求参数,获得返回结果为1-5,将结果数据保存在mysql数据库中。
2.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述方法还包括数据可视化步骤,具体为:将支持向量机训练模型步骤中的区域经济繁荣度的标记结果在地图上标识出来,并根据标记结果标识不同颜色。
3.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述确定用于计算区域经济繁荣度的数据维度为半径300米内企业注册资本的总和、半径300米内企业数量的总和的方法具体为:
根据业务经验给出备选的数据维度,备选的数据维度包括:半径300米内企业注册资本的均值、半径300米内企业注册资本的总和、半径300米内企业数量的总和、半径500米内企业注册资本的均值、半径500米内企业注册资本的总和、半径500米内企业数量的总和、半径1000米内企业注册资本的均值、半径1000米内企业注册资本的总和、半径1000米内企业数量的总和;
选取一测试区域作为测试数据,按所述测试区域内照经济繁荣度将所述测试区域进行人为标记分成5个档次,然后采用Pearson相关性分析方法来计算备选的数据维度与人为标记的不同档次的相关性,根据相关性,选择获得半径300米内企业注册资本的总和、和半径300米内企业数量的总和2个数据维度作为计算区域经济繁荣度的数据维度。
4.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,在样本数据选择的步骤中,每条样本数据均包括对应抽样城市中半径300米内企业注册资本的总和、以及半径300米内企业数量的总和。
5.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特
2