预测关联(数据挖掘中级教程)
在处理模型后,您可以使用模型中存储的关联的相关信息来创建预测。 在本课程的最后一个任务中,您将了解如何针对所创建的关联模型生成预测查询。 本课程假定您已经熟悉了如何使用预测查询生成器,同时希望了解如何生成针对关联模型的预测查询。 有关如何使用预测查询生成器的详细信息,请参阅 数据挖掘查询接口。
创建单独预测查询
针对关联模型的预测查询可能非常有用:
基于以前或相关的采购,向客户提出物料方面的建议
查找相关事件。
标识事务集中或事务集之间的关系。
若要生成预测查询,请先选择要使用的关联模型,然后指定输入数据。 输入可以来自外部数据源(例如值列表),也可以生成单独查询并随时提供值。
对此方案,您首先需要创建一些单独预测查询,以了解预测是如何运行的。 然后您将创建一个批预测的查询,以便根据客户当前的购买情况提出建议。
针对关联模型创建预测查询
单击数据挖掘Designer的“挖掘模型预测”选项卡。
在“ 挖掘模型 ”窗格中,单击“ 选择模型”。 (如果已选择正确的模型,则可跳过此步骤和下一步骤。)
在 “选择挖掘模型 ”对话框中,展开表示挖掘结构的“ 关联”节点,然后选择模型 关联。 单击“确定”。
现在,可以忽略“输入”窗格。
在网格中,单击“ 源 ”下的空单元格,然后选择“ 预测函数”。 在“ 字段”下的单元格中,选择
PredictAssociation
。还可以使用 Predict 函数来预测关联。 如果这样做,请确保选择以表列作为参数的 Predict 函数的版本。
在“挖掘模型”窗格中,选择嵌套表
vAssocSeqLineItems
,然后将其拖到网格中,然后拖到函数的PredictAssociation
“条件/参数”框中。通过拖放表和列名称可以生成没有语法错误的复杂语句。 但是,它将替换单元格的当前内容,其中包括函数的其他可选参数
PredictAssociation
。 为了查看其他参数,可以将函数的另一个实例临时添加到网格供参考。单击“ 条件/参数 ”框,并在表名称后键入以下文本:
,3
“ 条件/参数 ”框中的完整文本应如下所示:
[Association].[v Assoc Seq Line Items],3
单击预测查询生成器右上角的“ 结果 ”按钮。
预期结果包含标题为 Expression 的单个列。 “表达式”列包含一个嵌套表,其中包含单个列和以下三行。 由于未指定输入值,因此这些预测表示整个模型最可能的产品关联。
型号 |
---|
Women's Mountain Shorts |
Water Bottle |
Touring-3000 |
接下来,你将使用“ 单一查询输入 ”窗格将产品指定为查询的输入,并查看最有可能与该项目关联的产品。
创建带有嵌套表输入的单独预测查询
单击预测查询生成器一角的“ 设计 ”按钮,切换回查询生成网格。
在“ 挖掘模型 ”菜单上,选择“ 单一实例查询”。
在“ 挖掘模型 ”对话框中,选择 “关联 ”模型。
在网格中,单击“ 源 ”下的空单元格,然后选择“ 预测函数”。 在“ 字段”下的单元格中,选择
PredictAssociation
。在“挖掘模型”窗格中,选择嵌套表
vAssocSeqLineItems
,然后将其拖到网格中,然后拖到函数的PredictAssociation
“条件/参数”框中。 在嵌套表名称后键入,3
,就像在上一过程中一样。在“单一查询输入”对话框中,单击 vAssoc Seq 行项旁边的“值”框,然后单击“ (...”) 按钮。
在“嵌套表输入”对话框中,在“键列”窗格中选择
Touring Tire
,然后单击“添加”。单击“ 结果” 按钮。
现在结果显示最可能与 Touring Tire 关联的产品的预测。
型号 |
---|
Touring Tire Tube |
Sport-100 |
Water Bottle |
但是,您已经通过浏览模型了解到,客户经常同时购买 Touring Tire 和 Touring Tire Tube;您更愿意了解您能够向同时购买这些商品的客户推荐哪些产品。 您将更改查询以便根据市场篮中的两个项目预测相关产品。 您还将修改查询以添加所有预测产品的概率。
向单独预测查询添加输入和概率
单击预测查询生成器一角的“ 设计 ”按钮,切换回查询生成网格。
在“单一查询输入”对话框中,单击 vAssoc Seq 行项旁边的“值”框,然后单击“ (...”) 按钮。
在 “键”列 窗格中,选择
Touring Tire
,然后单击“ 添加”。在网格中,单击“ 源 ”下的空单元格,然后选择“ 预测函数”。 在“ 字段”下的单元格中,选择
PredictAssociation
。在“挖掘模型”窗格中,选择嵌套表
vAssocSeqLineItems
,然后将其拖到网格中,然后拖到函数的PredictAssociation
“条件/参数”框中。 在嵌套表名称后键入,3
,就像在上一过程中一样。在“嵌套表输入”对话框中,在“键列”窗格中选择
Touring Tire Tube
,然后单击“添加”。在网格中,在函数的
PredictAssociation
行中,单击“ 条件/参数 ”框,然后更改参数以添加参数,INCLUDE_STATISTICS。“ 条件/参数 ”框中的完整文本应如下所示:
[Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3
单击“ 结果” 按钮。
嵌套表中的结果现在更改为同时显示支持率和概率的预测。 有关如何解释这些值的详细信息,请参阅 关联模型的挖掘模型内容 (Analysis Services - 数据挖掘) 。
型号 | $SUPPORT | $PROBABILITY | $ADJUSTEDPROBABILITY |
---|---|---|---|
Sport-100 | 4334 | 0.291... | 0.252... |
Water Bottle | 2866 | 0.192... | 0.175... |
Patch Kit | 2113 | 0.142... | 0.132 |
使用结果
如果结果中有很多嵌套表,您可能希望简化结果以便查看。 为此,您可以手动修改查询并添加 FLATTENED
关键字。
平展预测查询中的嵌套行集
单击预测查询生成器一角的 SQL 按钮。
网格更改为一个打开的窗格,在此您可以查看和修改由预测查询生成器创建的 DMX 语句。
在
SELECT
关键字后键入FLATTENED
。查询的完整文本应如下所示:
SELECT FLATTENED PredictAssociation([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,3) FROM [Association] NATURAL PREDICTION JOIN (SELECT (SELECT 'Touring Tire' AS [Model] UNION SELECT 'Touring Tire Tube' AS [Model]) AS [v Assoc Seq Line Items]) AS t
单击预测查询生成器右上角的“ 结果 ”按钮。
请注意,手动编辑查询之后,将无法切换回设计视图而不丢失更改。 如果希望保存查询,可以将创建的 DMX 语句手动复制到一个文本文件中。 更改回设计视图后,查询会恢复到设计视图中有效的上一版本。
创建多个预测
假设您希望根据以往的购买情况了解每个客户的最佳预测。 您可以使用外部数据作为预测查询的输入,例如包含客户 ID 和最近产品购买情况的表。 要求是,这些数据表已经定义为 Analysis Services 数据源视图;而且输入数据必须包含事例和类似模型中使用的嵌套表。 不需要相同的名称,但结构必须相似。 为了实现本教程教学目的,您将使用对模型进行定型的原始表。
更改预测查询的输入方法
在“挖掘模型”菜单中,再次选择“单一实例查询”以清除检查标记。
出现一条错误消息警告您单独查询将丢失。 单击 “是” 。
输入对话框的名称将更改为 “选择输入表” () 。
您希望创建一个预测查询,以将客户 ID 和产品列表作为输入,因此需要将客户表添加为事例表,将采购表添加为嵌套表。 然后您将添加预测函数来创建建议。
使用嵌套表输入创建预测查询
在“挖掘模型”窗格中选择 Association Filtered 模型。
在 “选择输入表 () 对话框中,单击” 选择事例表”。
在“ 选择表 ”对话框中,对于“ 数据源”,选择“AdventureWorksDW2008”。 在 “表/视图名称” 列表中,选择“vAssocSeqOrders”,然后单击“ 确定”。
将表 vAssocSeqOrders 添加到窗格中。
在 “选择输入表 () 对话框中,单击” 选择嵌套表”。
在“ 选择表 ”对话框中,对于“ 数据源”,选择“AdventureWorksDW2008”。 在 “表/视图名称 ”列表中,选择“vAssocSeqLineItems”,然后单击“ 确定”。
将表 vAssocSeqLineItems 添加到窗格中。
在“ 指定嵌套联接 ”对话框中,从事例表中拖动“OrderNumber”字段,并将其拖放到嵌套表中的“OrderNumber”字段。
还可以单击“ 添加关系 ”,并通过从列表中选择列来创建关系。
在“ 指定关系 ”对话框中,验证“OrderNumber”字段是否已正确映射,然后单击“ 确定”。
单击“ 确定 ”关闭“ 指定嵌套联接 ”对话框。
在“设计”窗格中将更新事例表和嵌套表,显示将外部数据列连接到模型中的列的联接。 如果关系错误,可以右键单击联接线并选择“ 修改连接” 以编辑列映射,也可以右键单击联接线并选择“ 删除 ”以完全删除关系。
在网格中添加一个新行。 对于 “源”,选择“ vAssocSeqOrders 表”。 对于 “字段”,选择“CustomerKey”。
在网格中添加一个新行。 对于 “源”,选择“ vAssocSeqOrders 表”。 对于 “字段”,选择“区域”。
在网格中添加一个新行。 对于“源”,选择“预测函数”,对于“字段”,请选择 。
PredictAssociation
将 vAssocSeqLineItems 拖到行的
PredictAssociation
“条件/参数”框中。 单击“ 条件/参数 ”框末尾,然后键入以下文本:INCLUDE_STATISTICS,3
“ 条件/参数 ”框中的完整文本应为:
[Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 3
单击“ 结果 ”按钮查看每个客户的预测。
您可以尝试针对多个模型创建一个相似的预测查询,来查看筛选是否会更改预测结果。 有关创建预测和其他类型的查询的详细信息,请参阅 关联模型查询示例。
另请参阅
关联模型的挖掘模型内容(Analysis Services – 数据挖掘)
PredictAssociation (DMX)
使用预测查询生成器创建预测查询