龙源期刊网 http://www.qikan.com.cn
数据挖掘与分析
作者:林文渊
来源:《新课程·教研版》2011年第17期
摘 要:近年来,数据挖掘引起了社会各界特别是信息产业界的极大关注,其主要原因是在统计学和数据库知识高速发展的今天,以前积累了大量数据,迫切需要将这些数据转换成有用的信息和知识。通过数据挖掘技术获取的信息和知识可以广泛用于各个领域,包括商务管理、生产控制、市场分析、工程设计和科学探索等。
关键词:数据挖掘;数据仓库;直接数据挖掘;间接数据挖掘
一、数据挖掘的定义
数据挖掘,在人工智能领域,习惯上又称为数据库中知识发现(Knowledge Discovery in Database,简称为KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。换言之,就是从存放在数据库、数据仓库或其他信息库中大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。 二、数据挖掘的关键步骤 1.挖掘
把潜在的不明确数据关系的数据提取并转化为数学问题。这一步的结果只是表明数据之间有关系,但是具体是什么关系仍然不明确。 2.建模
把不明确的数据关系通过数学建模过程转化为明显的数据关系,即把数据之间的内在变化规律由数学符号与数学结构表示出来。 三、数据挖掘分类 1.直接数据挖掘
目标是利用可用的数据建立一个模型,这个模型对剩余的数据,即一个特定的变量进行描述。
2.间接数据挖掘
数据挖掘与分析



