商务智能实验报告

由天下分享时间：2025/1/29 5:49:29 加入收藏我要投稿点赞

《数据挖掘与商务智能实验》

实验报告

实验题目：分类分析：决策树姓名：王俊学号：

指导教师：张大斌实验时间： 2016..

2016年月 12

11 日实验9 分析类型：决策树一、实验目的

（1）了解和熟悉SPSS Modeler及其相关知识；（2）掌握SPSS Modeler工具建立CHAID决策树的方法；（3）学会运用SPSS CHAID决策树进行相关的内容分析。

二、实验内容

本实验以电信客户数据（文件名为）为例，数据中包含的变量x1到x15分别是：

居住地、年龄、婚姻情况、家庭月收入（百万）、受教育程度、性别、家庭人数、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性免费服务项目的费用、无线服务费用、是否电子支付、客户所申请的服务套餐类型和是否流失。本节的分析是在基本分析的基础上进行的，具体的CHAID算法如下所示：

三、实验步骤与结果步骤1 创建CHAID数据流

（1）通过“statistic文件”节点读入文件名为的数据。

（2）数据流中添加“分区”节点，将样本集划分为训练集和测试集，如图9-1所示。

（3）选择建模模块中的“CHAID(C)”节点，将其连接到数据流的恰当位置。

步骤2 设置具体参数

（1）右击鼠标，在“构建选项”-“基本（B）”，选择数的生长算法为Exhaustive CHAID。

自定义最大树状图深度为5，如图9-2所示。（2）其他相关参数默认设置。步骤3 结果运行实验结果如图9-3所示。

CHIAID首先确定开通月数为最佳的分组变量，将其分为3组，开通月数小于等于5的，开通月数大于31和开通月数大于5小于30的。按照一层一层进行分组，但很快会发现其中某些推理规则没有太大的参考价值。例如，对于开通月数大于31个月的用户，无论是否采用电子支付方式，年龄如何，婚姻如何，最终的结果都是未流失。这种情况

于该算法的剪枝方式有一定的联系。

四、实验分析与扩展练习

实验分析：

对于CHAID算法，SPSS Modeler如何进行交互方式建模？

答：在进行交互建模时候，以下这些参数的调整都会对建模的结果造成一定的影响：

A.数据分区中的训练和测试分区以及设置随机种子

B.相关CHAID参数设置中的树生长算法选择和最大树状图深度设置

C.相关CHAID参数设置中的成长规则 D.相关CHAID参数设置中的整体设置

D.相关CHAID参数设置中的高级设置的分割和合并

五、结论与讨论(重点)

通过这次实验，我总结一下知识点： 1.决策树算法的优点如下：（1）分类精度高；（2）生成的模式简单；

（3）对噪声数据有很好的健壮性。

因而是目前应用最为广泛的归纳推理算法之一，在数据挖掘中受到研究者的广泛关注。的一般步骤：

（1.）属性变量的预处理（2.）确定当前分支变量和分隔值属性变量的预处理：

（1）对定类的属性变量，在其多个分类水平中找到对目标变量取值影响不

显着的分类，并合并它们；

（2）对定距型属性变量，先按分位点分组，然后再合并具有同质性的组；（3）如果目标变量是定类变量，则采用卡方检验（4）如果目标变量为定距变量，则采用F检验

每对预测分类的评估，以确定最显着差异的因变量。由于这些合并步骤，通过计算修正邦费罗尼p值来合并交叉表。算法优点：

（1）可产生多分枝的决策树（2）目标变量可以定距或定类

（3）从统计显着性角度确定分支变量和分割值，进而优化树的分枝过程（4）建立在因果关系探讨中，依据目标变量实现对输入变量众多水平划分 (格式按华南农业大学论文格式)

商务智能实验报告

《数据挖掘与商务智能实验》实验报告实验题目：分类分析：决策树姓名：王俊学号：指导教师：

推荐度：

点击下载文档文档为doc格式

商务智能实验报告

商务智能实验报告

相关推荐文档

精选图文

热门排序

推荐文章

热门标签

相关文章列表

商务智能实验 报告

商务智能实验 报告

相关推荐文档

精选图文

热门排序

推荐文章

热门标签

相关文章列表

商务智能实验报告

商务智能实验报告