为结构指定测试数据集(数据挖掘基础教程)
在数据挖掘向导的最后几个屏幕上,将把数据拆分成测试集和定型集。 随后您将命名您的结构并针对模型启用钻取。
指定测试集
在创建挖掘结构时将数据分成定型集和测试集,可以轻松地评估以后创建的挖掘模型的准确性。 有关测试集的详细信息,请参阅 训练和测试数据集。
指定测试集
在 “创建测试集 ”页上,对于 “要测试的数据百分比”,保留默认值
30
。对于 测试数据集中的最大事例数,请键入
1000
。单击“下一步”。
指定钻取
可以针对模型和结构启用钻取。 此对话框中的复选框可对命名模型启用钻取功能。 处理模型后,你将能够从用于创建模型的训练数据中检索详细信息。
如果基础挖掘结构也已经配置为允许进行钻取,则可以从模型事例和挖掘结构返回详细信息(其中包括挖掘模型中所不包含的列)。 有关详细信息,请参阅 钻取查询 (数据挖掘) 。
命名模型和结构并指定钻取
在 “完成向导” 页上的 “挖掘结构名称”中,键入
Targeted Mailing
。在 “挖掘模型名称”中,键入
TM_Decision_Tree
。选择“允许钻取检查框。
查看 “预览 ”窗格。 请注意,仅显示选择为 “键”、“ 输入” 或“ 可预测”的 列。 您选择的其他列(例如,AddressLine1)不能用于生成模型,但是将在基础结构中可用,您可以在处理和部署模型之后查询这些列。
单击“完成”。