好文档 - 专业文书写作范文服务资料分享网站

数据仓库与数据挖掘实验报告

天下 分享 时间: 加入收藏 我要投稿 点赞

一、上机目的及内容

目的:

1.理解数据挖掘的基本概念及其过程;

2.理解数据挖掘与数据仓库、OLAP之间的关系

3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。 内容:

将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft 决策树”算法在客户群中找出购买自行车模式。请将要挖掘的维度(事例维度)设置为客户,再将客户的属性设置为数据挖掘算法识别模式时要使用的信息。然后算法将使用决策树从中确定模式。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式选择潜在的客户发送自行车促销信息。 要求:

利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出模型及操作过程。实验完成后,应根据实验情况写出实验报告。

二、实验原理及基本技术路线图(方框原理图或程序流程图)

关联分析:关联分析是从数据库中发现知识的一类重要方法。 时序模式:通过时间序列搜索出重复发生概率较高的模式。

分类:分类是在聚类的基础上对已确定的类找出该类别的概念描述,代表了这类数据的整体信息,既该类的内涵描述,一般用规则或决策树模式表示。

三、所用仪器、材料(设备名称、型号、规格等或使用软件)

1台PC及Microsoft SQL Server套件

四、实验方法、步骤(或:程序代码或操作过程)及实验过程原始记录( 测试数据、图表、计算等)

创建 Analysis Services 项目

1. 2. 3. 4. 5.

打开 Business Intelligence Development Studio。 在“文件”菜单上,指向“新建”,然后选择“项目”。 确保已选中“模板”窗格中的“Analysis Services 项目”。 在“名称”框中,将新项目命名为 AdventureWorks。 单击“确定”。

-1-

更改存储数据挖掘对象的实例 1. 2. 3.

在 Business Intelligence Development Studio 的“项目”菜单中,选择“属性”。 在“属性页”窗格的左侧,单击“部署”。

在“目标”选项部分,验证数据库名称是否为 localhost。如果使用的是其他实例,请键入该实例的名称。单击“确定”。

创建数据源

-2-

1.

在解决方案资源管理器中,右键单击“数据源”文件夹,然后选择“新建数据源”。

系统将打开数据源向导。

2.

在“欢迎使用数据源向导”页面中,单击“下一步”按钮。

3.

在“选择如何定义连接”页上,单击“新建”向 Adventure Works 数据库中添加连接。

-3-

系统将打开“连接管理器”对话框。

4.

在“连接管理器”的“提供程序”列表中,选择“本机 OLE DB\\Microsoft OLE DB Provider for SQL Server”。

在“服务器名称”列表中,键入或选择承载 AdventureWorksDW 的服务器的名称。 在“登录到服务器”组中,选择身份验证方法,并输入凭据。

在“选择或输入数据库名称”列表中,选择 AdventureWorksDW,再单击“确定”按钮。 单击“下一步”按钮进入向导的下一页。

在“模拟信息”页中,选择“使用服务帐户”,再单击“下一步”。

请注意,在“完成向导”页中,数据源名称默认为 Adventure Works DW。

5. 6. 7. 8. 9.

10.

11.

单击“完成”。

新的数据源 Adventure Works DW 将显示在解决方案资源管理器的“数据源”文件夹中。

-4-

创建数据源视图

1.

在解决方案资源管理器中,右键单击“数据源视图”,选择“新建数据源视图”。 系统将打开数据源视图向导。

2. 3.

在“欢迎使用数据源视图向导”页上,单击“下一步”。

在“选择数据源”页的“关系数据源”下,系统将默认选中您在上一个任务中创建的 Adventure Works DW 数据源。 单击“下一步”。

若要创建新数据源,请单击“新建数据源”,启动数据源向导。

4.

? ?

在“选择表和视图”页上,选择下列各表,然后单击右箭头键,将这些表包括在新数据源视图中:

dbo.ProspectiveBuyer dbo.vAssocSeqLineItems

-5-

数据仓库与数据挖掘实验报告

一、上机目的及内容目的:1.理解数据挖掘的基本概念及其过程;2.理解数据挖掘与数据仓库、OLAP之间的关系3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘相关工具的使用。内容:将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft决策树”算法在客户群中找出购买自行车模式
推荐度:
点击下载文档文档为doc格式
7wban1os3a0n19a8i5hx
领取福利

微信扫码领取福利

微信扫码分享