.
《数据挖掘与商务智能实验》
实 验 报 告
实验题目: 分类分析:决策树 姓名: 王俊 学号: 201430850164 指导教师: 张大斌 实验时间: 2016..11.10
2016年 11 月 12 日
.
.
实验9 分析类型:决策树 一、 实验目的
(1) 了解和熟悉SPSS Modeler及其相关知识; (2) 掌握SPSS Modeler工具建立CHAID决策树的方法; (3) 学会运用SPSS CHAID决策树进行相关的内容分析。
二、 实验内容
本实验以电信客户数据(文件名为Telephone.sav)为例,数据中包含的
变量x1到x15分别是:居住地、年龄、婚姻情况、家庭月收入(百万)、受教育程度、性别、家庭人数、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性免费服务项目的费用、无线服务费用、是否电子支付、客户所申请的服务套餐类型和是否流失。本节的分析是在基本分析的基础上进行的,具体的CHAID算法如下所示:
三、 实验步骤与结果 步骤1 创建CHAID数据流
(1)通过“statistic文件”节点读入文件名为Telephone.sav的数据。 (2)数据流中添加“分区”节点,将样本集划分为训练集和测试集,如图9-1所示。
(3)选择建模模块中的“CHAID(C)”节点,将其连接到数据流的恰当位置。
.
.
步骤2 设置具体参数
(1)右击鼠标,在“构建选项”-“基本(B)”,选择数的生长算法为Exhaustive CHAID。
自定义最大树状图深度为5,如图9-2所示。
(2)其他相关参数默认设置。 步骤3 结果运行 实验结果如图9-3所示。
.