.. . .
..
二、大数据平台建设 (一)大数据平台框架概述
大数据平台建设充分整合信息化资源,打破行业、部门之间的信息壁垒,运用大数据技术进行采集、加工、建模、分析,将数据价值融入到金融之中,从而提升创新能力和产品服务能力。主要包括以下三部分:
1.大数据分析基础平台
按照功能划分数据区,设计数据模型,在统一流程调度下,整合各类数据,同现有的企业级数据仓库和历史数据存储系统一起,形成基础数据体系,提供支撑经营管理的各类数据应用,支撑上层应用。
2.大数据应用系统
基于基础数据平台,持续建设各类数据应用系统,通过数据挖掘、计量分析和机器学习等手段,对丰富的大数据资源进行开发使用,并将数据决策化过程结合到风控、营销、营运等经营管理活动,充分发挥大数据价值。
3.大数据管控
建立数据标准,提升数据质量,加强元数据管理能力,为平台建设及安全提供保障(二)大数据平台建设原则
大数据平台是大数据运用的基础实施,其设计、建设和系统实现过程中,应遵循如下指导原则:
经济性:基于现有场景分析,对数据量进行合理评估,确定大数据平台规模,后续根据实际情况再逐步优化扩
. 学习参考 .
.. . .
..
容。
可扩展性:架构设计与功能划分模块化,考虑各接口的开放性、可扩展性,便于系统的快速扩展与维护,便于第三方系统的快速接入。
可靠性:系统采用的系统结构、技术措施、开发手段都应建立在已经相当成熟的应用基础上,在技术服务和维护响应上同用户积极配合,确保系统的可靠;对数据指标要保证完整性,准确性。
安全性:针对系统级、应用级、网络级,均提供合理的安全手段和措施,为系统提供全方位的安全实施方案,确保企业内部信息的安全。大数据技术必须自主可控。
先进性:涵盖结构化,半结构化和非结构化数据存储和分析的特点。借鉴互联网大数据存储及分析的实践,使平台具有良好的先进性和弹性。支撑当前及未来数据应用需求,引入对应大数据相关技术。
平台性:归纳整理大数据需求,形成统一的大数据存储服务和大数据分析服务。利用多租户, 实现计算负荷和数据访问负荷隔离。多集群统一管理。
分层解耦:大数据平台提供开放的、标准的接口,实现与各应用产品的无缝对接
(三)基础数据来源 1.银行内部大数据资源
. 学习参考 .
.. . .
..
客户自身信息以及其金融交易行为,依照目前积累沉淀的数量资源情况,将数据主要分为三大类:
第一类:客户基础数据
客户信息数据,即客户基础数据,主要是指描述客户自身特点的数据。
个人客户信息数据包括:个人姓名、性别、年龄、身份信息、联系方式、职业、生活城市、工作地点、家庭地址、所属行业、具体职业、婚姻状况、教育情况、工作经历、工作技能、账户信息、产品信息、个人爱好等等。
企业客户信息数据包括:企业名称、关联企业、所属行业、销售金额、注册资本、账户信息、企业规模、企业地点、分公司情况、客户和供应商、信用评价、主营业务、法人信息等等。
将这些割裂的数据整合到大数据平台,形成全局数据,再按照自身需要进行归类和打标签,由于都是结构化数据因此将有利于数据分析。可以将这些信息集中在大数据管理平台,对客户进行分类,依据其他的交易数据,进行产品开发和决策支持。
第二类:支付信息
交易信息数据,可以称之为支付信息,主要是指客户通过渠道发生的交易以及现金流信息。
个人客户交易信息:包括工资收入、个人消费、公共
. 学习参考 .
.. . .
..
事业缴费、信贷还款、转账交易、委托扣款、购买理财产品、购买保险产品、信用卡还款等。
企业客户交易信息:包括供应链应收款项、供应链应付款项、员工工资、企业运营支出、同分公司之间交易、同总公司之间交易、税金支出、理财产品买卖、金融衍生产品购买、公共费用支出、其他转账等。
第三类:资产信息
资产信息主要是指客户在金融机构端资产和负债信息,同时也包含金融机构自身资产负债信息,其中数据大多来自银行。
个人客户资产负债信息包括:购买的理财产品、定期存款、活期存款、信用贷款、抵押贷款、信用卡负债、抵押房产、企业年金等。
企业客户资产负债信息包括:企业定期存款、活期存款、信用贷款、抵押贷款、担保额度、应收账款、应付账款、理财产品、票据、债券、固定资产等。
银行自身端资产负债信息包括:自身资产和负债例如活期存款、定期存款、借入负债、结算负债、现金资产、固定资产贷款证券投资等。
第四类:新型业务数据
此类数据包括系统的运行日志、客服语音、视频影像、网站日志等。
. 学习参考 .
.. . .
..
2.外部大数据来源
为了赢得差异化竞争,就必须考虑其他数据源的输入,这些数据是自身不具有的,但是对其数据分析和决策起到了很重要的作用。
线上交易、电商平台、社交网络等互联网数据来源,司法、工商、财税等政府部门依法公开的信息,主要包括:互联网消费行为数据 ,了解客户消费能力和消费偏好 等;个人严重行政处罚记录(如行政拘留等)、刑事犯罪记录、涉诉情况(人身关系、财产关系)、交通严重违规违章记录 等;客户征信信息 、客户在其他银行或金融机构的贷款记录、信用记录等信息等 ;客户的第三方征信评级情况,客户的社保、纳税、公积金等信息 ,客户的社会保障情况及经济能力 ,工作单位性质 ,客户社会身份 等;客户在第三方催收机构的催收记录、社会信息 等;出入境记录, 客户出入境目的地、出入境频率等;国内出行记录 ,客户出行习惯等 ;采用同大数据厂商合作的方式,通过自身平台来采集数据或购买第三方数据。
(四)大数据平台实现功能
. 学习参考 .