为结构指定测试数据集(数据挖掘基础教程)

 

适用于: SQL Server 2016 Preview

在数据挖掘向导的最后几个屏幕上,将把数据拆分成测试集和定型集。 随后您将命名您的结构并针对模型启用钻取。

指定测试集

在创建挖掘结构时将数据分成定型集和测试集,可以轻松地评估以后创建的挖掘模型的准确性。 测试集的详细信息,请参阅 定型和测试数据集

若要指定测试集

  1. 创建测试集 页上,为 的测试数据百分比, ,保留默认值为 30

  2. 有关 中测试数据集中的事例的最大数目, ,类型 1000年

  3. 单击“下一步” 。

指定钻取

可以针对模型和结构启用钻取。 此对话框中的复选框可对命名模型启用钻取功能。 在处理了该模型后,您将能够从定型数据中检索用于创建模型的详细信息。

如果基础挖掘结构也已经配置为允许进行钻取,则可以从模型事例和挖掘结构返回详细信息(其中包括挖掘模型中所不包含的列)。 有关详细信息,请参阅钻取查询(数据挖掘)

命名模型和结构并指定钻取

  1. 正在完成向导 页上,在 挖掘结构名称, ,类型 Targeted Mailing

  2. 挖掘模型名称, ,类型 TM_Decision_Tree

  3. 选择 允许钻取 复选框。

  4. 查看 预览 窗格。 请注意,只有选择为那些列 密钥, ,输入可预测 显示。 您选择的其他列(例如,AddressLine1)不能用于生成模型,但是将在基础结构中可用,您可以在处理和部署模型之后查询这些列。

  5. 单击 “完成”

课程中的前一个任务

指定的数据类型和内容类型和 #40;数据挖掘基础教程 )

下一课

第 3 课:添加和处理模型

另请参阅

对挖掘模型启用钻取
钻取查询(数据挖掘)
指定定型数据(数据挖掘向导)