第 2 课:向市场篮挖掘结构中添加挖掘模型
适用于: SQL Server 2016 Preview
在本课程中,您将向你在中创建的市场篮挖掘结构中添加两个挖掘模型 第 1 课︰ 创建市场篮挖掘结构。 您可以通过这些挖掘模型创建预测。
若要预测的客户想要同时购买的产品类型,您将创建两个挖掘模型使用 Microsoft 关联算法 和两个不同值 MINIMUM_PROBABILTY 参数。
MINIMUM_PROBABILTY 是 Microsoft 关联算法参数,以帮助确定挖掘模型将包含通过指定规则必须具有的最小概率的规则数。 例如,如果此值设置为 0.4,则表明仅当规则所描述的产品组合具有至少 40% 的发生概率时才可生成此规则。
您将查看更改的效果 MINIMUM_PROBABILTY 中后面的课程中的参数。
ALTER MINING STRUCTURE 语句
若要添加包含到挖掘结构的嵌套的表的挖掘模型,您可以使用 ALTER MINING STRUCTURE #40; DMX ) 语句。 可以将语句中的代码分为下列几部分:
标识挖掘结构
命名挖掘模型
定义键列
定义输入列和可预测列
定义嵌套表列
标识算法和参数更改
下面是一般示例, ALTER MINING STRUCTURE 语句将挖掘模型添加到一个结构,其中包含嵌套的表列︰
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
上述代码的第一行标识要向其添加挖掘模型的现有挖掘结构:
ALTER MINING STRUCTURE [<mining structure name>]
代码的第二行对将要添加到挖掘结构中的挖掘模型进行命名:
ADD MINING MODEL [<mining model name>]
有关命名的对象中的数据挖掘扩展插件 (DMX) 的信息,请参阅 标识符 #40; DMX )。
代码的接下来的各行对挖掘结构中将由挖掘模型使用的各列进行定义:
[<key column>],
<mining model columns> <usage>,
您可以只使用挖掘结构中已有的列。
挖掘模型列的列表中的第一列必须为挖掘结构中的键列。 但是,不需要键入 密钥 后可实现︰ 使用情况的键列。 这是因为您在创建挖掘结构时已将列定义为键。
其他行指定新挖掘模型中的列的用法。 您可以指定,将通过使用以下语法用于进行预测挖掘模型中的列︰
<column name> PREDICT,
如果没有指定用法,则不必在列表中包含数据挖掘结构列。 由引用的数据挖掘结构所使用的所有列可自动用于基于该结构的挖掘模型中。 但是,除非您指定用法,否则模型不会将这些列用于定型。
代码的最后一行定义将用于生成挖掘模型的算法和算法参数。
) USING <algorithm>( <algorithm parameters> )
课程任务
在本课程中,将执行以下任务︰
使用默认的概率向结构中添加关联挖掘模型
使用修改的概率向结构中添加关联挖掘模型
使用默认的 MINIMUM_PROBABILITY 向结构中添加关联挖掘模型
第一个任务是添加新的挖掘模型向市场篮挖掘结构基于 Microsoft 关联算法使用的默认值为 MINIMUM_PROBABILITY。
添加关联挖掘模型
在 对象资源管理器, ,用鼠标右键单击实例 Analysis Services, ,指向 新查询, ,然后单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
备注
若要对特定的 Analysis Services 数据库创建 DMX 查询,请右键单击该数据库而不是右键单击实例。一般示例复制 ALTER MINING STRUCTURE 到空白查询语句。
将
<mining structure name>
使用︰
[Market Basket]
将
<mining model name>
使用︰
[Default Association]
将
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
使用︰
OrderNumber, [Products] PREDICT ( [Model] )
在这种情况下,
[Products]
表已被指定为可预测列**。** 此外,[Model]
列包含在嵌套的表列的列表,因为它是嵌套表的键列。备注
请注意,嵌套键不同于事例键。 事例键是事例的唯一标识符,而嵌套键是您想要建模的属性。将
USING <algorithm>( <algorithm parameters> )
使用︰
Using Microsoft_Association_Rules
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules
在 文件 菜单上,单击 dmxquery1.dmx 另存为。
在 另存为 对话框中,浏览到相应的文件夹,并将文件 Default_Association_Model.dmx。
在工具栏上,单击 Execute 按钮。
向结构中添加关联挖掘模型并更改默认的 MINIMUM_PROBABILITY
下一个任务是根据 Microsoft 关联算法,向市场篮挖掘结构中添加新的挖掘模型,并将 MINIMUM_PROBABILITY 的默认值改为 0.01。 更改参数会导致 Microsoft 关联算法创建更多的规则。
添加关联挖掘模型
在 对象资源管理器, ,用鼠标右键单击实例 Analysis Services, ,指向 新查询, ,然后单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
一般示例复制 ALTER MINING STRUCTURE 到空白查询语句。
将
<mining structure name>
使用︰
Market Basket
将
<mining model name>
使用︰
[Modified Association]
将
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
使用︰
OrderNumber, [Products] PREDICT ( [Model] )
在本例中,
[Products]
表已被指定为可预测列。 此外,[MODEL]
列包含于列表中,原因在于它是嵌套表的键列。将
USING <algorithm>( <algorithm parameters> )
使用︰
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
在 文件 菜单上,单击 dmxquery1.dmx 另存为。
在 另存为 对话框中,浏览到相应的文件夹,并将文件 Modified Association_Model.dmx。
在工具栏上,单击 Execute 按钮。
在下一课中,您将处理市场篮挖掘结构及其关联的挖掘模型。