好文档 - 专业文书写作范文服务资料分享网站

浅谈数据挖掘技术及其相关问题解析

天下 分享 时间: 加入收藏 我要投稿 点赞

浅谈数据挖掘技术及其相关问题解析

摘要:数据挖掘(Data Mining,简称DM),又称数据库中的知识发现(Knowledge Discovery in Database,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基础上,结合当今企业对数据挖掘技术的重视和数据挖掘技术对企业发展带来的巨大效益的现状,从众多方面提出和分析了数据挖掘技术在发展和应用过程中面临的主要问题。并且结合开放网格服务体系(OGSA)的思想,采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等,设计了一种五层的网格数据挖掘体系结构(GDMA)。该体系结构以服务为核心,通过统一的网格服务接口屏蔽资源的异构性,并针对用户的特殊需求,设计了基于工作流和Web服务的数据挖掘客户端。

关键词:网格数据挖掘体系结构 开放网格服务体系 数据挖掘 网格计算

中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2014)04-0141-04

数据挖掘,顾名思义就是从大量的、不完全的、有噪声的、模糊的数据中挖掘出有用的信息和知识的过程。这些信

息和知识是隐含的,先前未知的,对决策有潜在价值的。随着计算机技术和信息技术应用的越来越广泛,企业每年都要积累大量的数据,运用数据挖掘技术在这些大量数据当中我们可以找出有价值的知识、规则或高层次的信息为决策提供依据,从而使数据仓库成为一个丰富可靠的资源为企业决策者服务。数据挖掘技术主要又分成“关联规则”、“时间序列”、“聚集”、“分类”、“估值”等这几类。

有效运用数据挖掘技术有助于企业分析关键因素,发现业务规律,揭示隐藏趋势,预测未知结果,达到增收节支的目的,处于更有利的竞争位置。人类进入信息化时代以后,短短的数年时间,积累了大量的数据,步入了“大数据时代”,使人类以前所未有的速度、厚度、细度和准确度对信息的掌握成为可能。面对大量的数据,基于充足的数据基础,对数据进行挖掘与分析,并将其运用于企业的精细管理,也就不仅成为可能而且势在必行。

以数据网格为基础,构建分布式数据挖掘体系,对于解决海量数据挖掘问题具有重要的理论意义和实用价值。目前网格挖掘体系结构主要存在两方面的问题:(1)网格挖掘体系结构标准不一,采用的技术也不同。目前几种主流的网格挖掘体系结构都是针对不同的应用而设计的。(2)网格中间件不够成熟。网格中间件实际上是一种网格操作系统,网格操作系统、网格应用与计算机操作系统和计算机应用软件相

比,存在很大的差距。只有当网格中间件与网格应用像目前计算机的系统软件和应用软件一样方便时,才能展现网格的真正优势。目前还没有一种网格体系结构能适应所有的应用,应借鉴已有网格体系结构的优点,设计适用于网格数据挖掘的体系结构。网格体系结构从最开始的五层沙漏体系(FLSGA),发展到开放网格服务体系(OGSA),再发展到Web服务资源框架(WSRF)。 1 数据挖掘的概念

数据挖掘(Data Mining,简称DM),又称数据库中的知识发现(Knowledge Discovery in Database,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术[2]。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。这些知识可以表示为概念、规则、规律、模式等形式。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。

随着数据挖掘技术的发展,数据挖掘的重要性己经被越

浅谈数据挖掘技术及其相关问题解析

浅谈数据挖掘技术及其相关问题解析摘要:数据挖掘(DataMining,简称DM),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基础上,结合当今企业对数据挖掘技术的重视和数据
推荐度:
点击下载文档文档为doc格式
2gd1l94o3u4qfr01784a35m4y31ezc0154f
领取福利

微信扫码领取福利

微信扫码分享