创建相关的顺序分析和聚类分析模型(数据挖掘中级教程)
通过浏览顺序分析和聚类分析模型,您了解到如 Region 或 Income 等其他属性对模型有巨大影响;因此为了更好地了解序列,您将创建一个相关的顺序分析和聚类分析模型,并删除与客户人口统计信息有关的属性。
在本任务中,您将创建区域顺序分析和聚类分析模型的副本,然后从该模型中删除与序列没有直接关系的任何列。
新模型包含的所有列与它所基于的挖掘模型的列相同。 但是,您不需要删除挖掘结构中的列,只需指定新挖掘模型忽略这些列即可。
创建顺序分析和聚类分析模型的副本
在 SQL Server Data Tools (SSDT) 的“数据挖掘Designer中,单击”挖掘模型“选项卡。
右键单击要复制的模型,然后选择“ 新建挖掘模型”。
在“ 新建挖掘模型 ”对话框中,键入模型名称,然后选择“Microsoft
Sequence Clustering
”。对于本教程,请键入名称
Sequence Clustering
。单击“确定”。
从挖掘模型中删除列
在“ 挖掘模型 ”选项卡的名为“顺序聚类分析”的新模型的列中,单击“ 收入组 ”属性的行,然后选择“ 忽略”。
对属性 “区域”重复此步骤。
单击表名称旁边的加号 v Assoc Seq 行项,展开表并查看嵌套表中的列。
新模型应该仅有以下列:
Order NumberKey
行号键
模型预测
处理新的顺序分析和聚类分析模型
在“ 挖掘模型 ”选项卡中,右键单击名为
Sequence Clustering
的新模型,然后选择“ 处理模型”。由于该新的简化挖掘模型基于已经处理过的结构,因此您不需要再重新处理该结构。 您只需处理该新的挖掘模型。
单击“ 是 ”将更新的数据挖掘项目部署到服务器。
在“ 处理挖掘模型 ”对话框中,单击“ 运行”。
单击“关闭”关闭“处理进度”对话框,然后在“处理挖掘模型”对话框中再次单击“关闭”。