好文档 - 专业文书写作范文服务资料分享网站

梅州市公共信用信息管理系统建设方案

天下 分享 时间: 加入收藏 我要投稿 点赞

(1)发布服务管理。发布服务管理的对象是目录服务器,它控制目录服务器的发布任务。并通过目录服务器的相关管理功能,实现特定信息资源的元数据是否可对外服务。

(2)发布网站管理。实现信用信息资源目录一站式网站的基本管理,包括网站运行、网页更新等。

5.目录接口子系统

目录接口系统的主要作用是为各部门信用信息共享业务系统提供统一的目录信息访问服务。该子系统包括两套接口模块:一套是采用“适配器”的方式进行建设的定制接口模块。定制接口模块主要用于与已有业务系统的对接,该模块根据不同部门现有信用信息共享业务系统的需求,为其定制个性化的接口。另一套是根据国家相关标准建立的通用接口模块,该模块根据国家有关标准,参考国际通用标准,构建一系列接口群。新开发的业务系统可利用通用接口模块开发其对目录信息的访问功能。 3.2. 数据归集及分发平台

公共信用信息管理系统数据归集及分发平台是市政务信息资源共享平台的子集,首先根据信用信息资源目录的要求,对政务信息资源共享平台的接入单位和共享指标项进行扩充,然后通过市政务信息资源共享平台归集各政府部门及相关单位的企业、个人、事业单位和社会组织的信用信息。

公共信用信息管理系统数据归集及分发平台不直接与各信源单位对接,当其他机构和其他信用信息系统需要向市公共信用信息管理系统提供信用数据时,首先接入市政务信

19

息资源共享平台,然后将信用数据传输给市公共信用信息管理系统数据归集及分发平台。

通过市公共信用信息管理系统数据归集及分发平台获取的信用数据,经过清洗比对,对于比对上的企业、个人、事业单位和社会组织由系统自动赋予一个唯一的信用码, 作为本系统内的唯一标识。清洗比对后的信用信息存储到公共信用信息数据库。

数据归集平台包括数据归集子系统、数据清洗子系统和数据比对子系统,数据分发平台主要由数据分发子系统组成。

3.2.1. 数据归集子系统

1.数据归集原则

市公共信用信息管理系统信用数据归集遵循以下三个原则:

(1)共享已有资源:市政务信息资源共享平台已经涵盖的部门,对于已经共享的指标项直接通过市政务信息资源共享平台获取。

(2)扩充指标项:市政务信息资源共享平台已经涵盖的部门,没有共享而市公共信用信息管理系统需要的指标项,在现有的基础上进行扩充,然后再通过市政务信息资源共享平台归集到市公共信用信息管理系统。

(3)扩充部门:市政务信息资源共享平台没有涵盖的政府部门、社会机构及其他信用信息系统,首先接入市政务信息资源共享平台,然后再将信用信息通过平台归集到市公共信用信息管理系统。

20

2.共建单位桥接方式

各共建单位可以根据自己的实际情况,选择合适的桥接方式,定期将本部门的新增和变动信用信息更新到前置机,然后通过市政务信息资源共享平台传输到市公共信用信息管理系统数据归集平台。可供选择的桥接方式有以下几种:

(1)数据库镜像:将本部门数据库与前置服务器数据库建立镜像,本部门的新增和变动数据自动实时同步到前置服务器数据库上;

(2)自行开发程序传输:自行开发数据传输程序,将本部门新增和变动的信用信息传输到前置服务器上;

(3)手工拷贝:定期通过人工拷贝方式,将本部门新增和变动的信用信息更新到前置服务器上。 3.2.2. 数据清洗子系统

1.数据清洗对象

数据清洗就是把不规范的数据格式整理为规范的数据。本系统归集的信用数据来自多个不同的政府部门、社会机构或者其他信用信息系统,难免存在不完整数据、错误数据和重复数据等。

2.数据清洗原理

数据清洗原理是指利用有关技术如数理统计、数据挖掘或预定义的清理规则将不完整数据、错误数据或重复数据转化为满足数据质量要求的数据。

3.数据清洗方式

数据清洗的实现方式可分为以下三种,本系统将根据信用数据的实际情况,将几种方式结合使用:

21

(1)手工清洗:指通过专门人员具体对数据进行检查比对。 通过人工检查,只要投入足够的人力物力财力,也能发现所有错误,但效率低下,在大数据量的情况下,几乎是不可能的。因此,当数据量较小,数据错误规律性不强时,一般采用手工清洗的方式。

(2)开发专门应用程序:这种方法能解决某类特定的问题,但不够灵活,特别是在清理过程需要反复进行时(一般而言,数据清洗很少能够一遍就达到要求),导致程序复杂,工作量比较大。因此,当大批量的数据存在一类或者多类特定的问题,数据错误规律性较强时,一般采用编写程序的方式。

(3)解决某类特定应用域的问题:如根据概率统计学原理查找数值异常的记录,对姓名、地址、邮政编码等进行清理。

4.数据清洗流程

(1)数据分析:对需要清洗的数据进行多角度分析,查看数据是否存在格式错误、逻辑错误等质量问题,从而对数据有一个全面的认识。

(2)定义错误类型:根据数据分析的结果,对发现的数据质量错误进行分类,并定义错误类型。

(3)搜索、识别错误记录:包括两种方式:一种是根据数据的错误类型,将具有这种错误的数据全部查找出来;另一种是根据数据的错误类型,将不具有这种错误的数据全部查找出来,剩下的数据就是具有这种错误类型的数据。前

22

一种方式适用于错误数据比例较低的情况;后一种方式适用于错误数据比例较高的情况。

(4)修正错误:某些特定领域能够根据发现的错误模式,编写程序或借助于外部工具在一定程度上对错误进行修正; 对数值字段,有时能根据数理统计知识自动修正。

(5)重复进行上述操作,直至数据没有错误,或者错误可以容忍为止。 3.2.3. 数据比对子系统

1.数据比对原则

(1)企业信息主键。企业名称+组织机构代码为企业(包括个体工商户)唯一标识码,由于工商局不掌握企业的组织机构代码信息,为方面数据比对,将工商注册号确定为重要辅助标识码,承担比对校核功能。

(2)个人信息主键。姓名+公民身份证号码作为个人的唯一识别码。

(3)事业单位信息主键。单位名称+组织机构代码作为事业单位唯一标识码,根据实际需要,为方面数据比对,将事业单位法人证书号确定为重要辅助标识码,承担比对校核功能。

(4)社会组织信息主键。单位名称+组织机构代码作为社会组织的唯一识别码。

(5)信用码。市公共信用信息管理系统将清洗比对后的企业、个人、事业单位和社会组织自动赋予唯一信用码,作为本系统内唯一标识。

(6)各共建单位交换信息的主键。为快速关联增量数

23

梅州市公共信用信息管理系统建设方案

(1)发布服务管理。发布服务管理的对象是目录服务器,它控制目录服务器的发布任务。并通过目录服务器的相关管理功能,实现特定信息资源的元数据是否可对外服务。(2)发布网站管理。实现信用信息资源目录一站式网站的基本管理,包括网站运行、网页更新等。5.目录接口子系统目录接口系统的主要作用是为各部门信用信息共享业务系统提供统一的目录信息访
推荐度:
点击下载文档文档为doc格式
7ucts1k7557e16g2f5026bod04q32p00owa
领取福利

微信扫码领取福利

微信扫码分享