好文档 - 专业文书写作范文服务资料分享网站

环保局环境信息数据仓库建设规划方案

天下 分享 时间: 加入收藏 我要投稿 点赞

12) 环境空间数据库:主要包括污染源、环境质量的空间数据信息。 环境信息数据仓库数据范围规划如下图:

搭建数据交换平台

搭建数据交换平台,建设ETL应用,实现ODS到数据仓库、数据仓库到数据集市的数据抽取、清晰、转换与加载。

数据交换平台是数据中心数据域其他应用系统沟通的桥梁,是进行数据交换的基站。数据交换平台负责从各个业务系统采集数据,对数据进行清洗与整合,按照数据中心建设标准规范数据,形成核心数据库,并提供给其他应用系统使用。

数据交换平台功能由支撑功能与应用功能两部分组成。支撑功能是数据交换平台的基础,包括数据采集、元数据管理、数据交换服务总线、平台监控以及安全管理功能;应用功能是指与具体业务系统相

6 / 19

关的功能,应用功能利用数据交换平台的数据交换服务总线,以数据交换服务的形式为各业务系统提供数据共享服务。 环境信息数据仓库ETL 过程如下图

各ETL 过程主要任务如下表 源系统 基础数据库 数据仓库 目标数据库 数据仓库 数据集市 ETL主要任务 抽取,转模,加载,去除重复数据 汇聚加载,满足BI分析要求 ETL 主要任务

源数据现状分析和映射

每做一步ETL工作之前都应对源数据进行全面的分析,包括如下内容:

7 / 19

? 数据的业务范围及业务含义

? 数据所在平台,包括系统平台和数据库平台 ? 数据结构 ? 数据更新周期 ? 数据更新方式 ? 数据量 数据抽取

数据抽取从数据源提取数据,供数据清洗和转换环节进行处理,数据抽取方式包括批量抽取和单次抽取两种方式,批量抽取可将所有历史数据一次性抽取完成;单次抽取根据规则要求进行抽取。 控制单次抽取可采用手工和自动两种方式,手工方式通过人为方式启动任务,自动方式基于调度程序,定期定时执行抽取任务。 抽取的检验:在抽取完成后,进行数据源与目标数据库的对比,发现并解决抽取过程产生的错误。

抽取的日志记录:在抽取过程中要全程记录抽取日志,至少包括:数据记录条数、开始时间、完成时间,错误信息等。 数据清洗

数据清洗的任务主要进行脏数据处理。

8 / 19

数据转换

数据转换的任务主要进行不一致的数据转换、数据粒度的转换,以及一些业务规则的计算。 数据加载

数据加载工作实现转换后数据的入库。在数据加载后,还要更新元数据,以反映刚完成的数据加载活动。数据的加载活动应使用标准方法和通用工具,例如,在关系数据库管理系统中可以使用SQL 或专门用于管理数据仓库的数据库管理系统加载工具。在数据装入数据仓库数据库后,应验证维度和事实数据表之间的引用完整性,确保所有的记录都与其他表中的适当记录相关。 数据缓存区规定

数据缓存区用来支持数据抽取、清理、转换并加载到数据仓库,应为数据缓存区创建单独的数据库。数据缓存区应包括传入数据的表、帮助实现代理键的表以及容纳转换数据的表,以及其他表以协调来自不同数据源的数据。

数据缓存区可做归档,以备后查。 ETL 周期设置

根据粒度设置要求对ETL 周期进行设置。

9 / 19

ETL 管理要求

对ETL 管理主要包括ETL 的调度管理和ETL 的监控管理。 ETL 调度管理要求包括三个方面的统一:统一界面、统一配置、统一调度。在界面方面,应实现统一的图形界面方式,且清晰易懂;在配置方面,应具备以下要素的配置要求:自动调度时间的设置、各调度要素之间逻辑关系的设置、指定调度要素的设置(包含指定数据源系统、功能模块、接口表等)、最大任务数的设置;在统一调度方面,应通过统一界面进行统一配置后,能够统一的进行调度程序的启动和停止。在不同阶段调用相应的资源进行处理,以支撑ETL 的整个过程。ETL 的调度支持流水线并行数据处理。

ETL 的监控管理包括对ETL 过程处理状态的监控,出错信息的监控,提供处理开始时间,完成时间,成功失败标识等,同时进行完整的处理日志记录,并提供通过对日志记录的分析达到对整个处理过程的统计和分析能力。一旦发现错误需要提供邮件等多种方式进行报警。

搭建地理信息平台

GIS(Geographic Information System)即地理信息系统,它是利用现代计算机图形和数据库技术来处理地理空间及其相关数据的计算机系统,是融地理学、测量学、几何学、计算机科学和应用对象为一体的综合性高新技术。 其最大的特点就在于: 它能把地球表面空间事物的地理位置及其特征有机地 结合在一起,并通过计算机屏幕形

10 / 19

环保局环境信息数据仓库建设规划方案

12)环境空间数据库:主要包括污染源、环境质量的空间数据信息。环境信息数据仓库数据范围规划如下图:搭建数据交换平台搭建数据交换平台,建设ETL应用,实现ODS到数据仓库、数据仓库到数据集市的数据抽取、清晰、转换与加载。数据交换平台是数据中心数据域其他应用系统沟通的桥梁,是进行数据交换的基站。数据交换平台负责从各个业务系统采集
推荐度:
点击下载文档文档为doc格式
409132m3gg7g2499ip734mu7526k9200fpv
领取福利

微信扫码领取福利

微信扫码分享