? EnglishEducation ? EnglishOccupation ? FirstName ? Gender ? GeographyKey ? HouseOwnerFlag ? LastName ? MaritalStatus ? NumberCarsOwned ? NumberChildrenAtHome ? Region ? TotalChildren ?
YearlyIncome
-11-
14.
单击“下一步”。
-12-
15. 在“指定列的内容和数据类型”页上,单击“检测”以运行对数值数据进行取样并确定数值列是否包
含连续或离散值的算法。例如,某列可包含薪金信息,用以作为连续的实际薪金值,也可包含整数,用以表示离散的编码薪金范围(例如 1 = < $25,000;2 = 从 $25,000 到 $50,000)。 16. 单击“检测”后,请查看“内容类型”和“数据类型”列中的各项;如有必要,请进行更改,以确保设
置与下表所示一致。
通常,向导会检测数值,并分配相应的数值数据类型;但有些情况下,您可能想要将数值作为文本处理。例如,GeographyKey 应作为文本处理,因为对此标识符进行数学运算是不对的。
列 Age BikeBuyer CommuteDistance CustomerKey EnglishEducation EnglishOccupation FirstName Gender GeographyKey HouseOwnerFlag LastName MaritalStatus NumberCarsOwned NumberChildrenAtHome Region TotalChildren YearlyIncome 内容类型 Continuous Discrete Discrete Key Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Discrete Continuous 数据类型 Long Long Text Long Text Text Text Text Text Text Text Text Long Long Text Long Double -13-
17. 18.
单击“下一步”。
在“将数据拆分为定型集和测试集”页上,对于“测试数据百分比”,请保留默认值 30。 对于“测试数据集中的最大事例数”,请键入 1000。单击“下一步”。
19.
20. 21. 22.
在“完成向导”页上的“挖掘结构名称”中,键入 Targeted Mailing。 在“挖掘模型名称”中,键入 TM_Decision_Tree。 选中“允许钻取”复选框。
-14-
23.
单击“完成”。
测试挖掘模型的准确性
映射输入列
如果使用外部数据测试挖掘模型,则必须确保挖掘结构中的列与输入数据中的列匹配。为此,可以使用“指定列映射”对话框。如果直接映射列名,则数据挖掘设计器将自动创建关系。
若要删除两列之间的映射,请选择将“挖掘结构”表中的列链接到“选择输入表”表中的列的行,再按 Delete 键。还可以通过单击“选择输入表”中的列并将其拖到“挖掘结构”中相应的列来手动创建映射。 将输入列映射到挖掘结构 1.
在数据挖掘设计器中的“挖掘准确性图表”选项卡的“输入选择”选项卡中,选择选项“指定其他数据集”。
-15-