第 2 课:向市场篮挖掘结构中添加挖掘模型
在本课中,将向第 1 课:创建市场篮挖掘结构中创建 的市场篮挖掘结构添加两个挖掘模型。 您可以通过这些挖掘模型创建预测。
为了预测客户倾向于同时购买的产品类型,你将使用 Microsoft 关联算法 创建两个挖掘模型,并为 MINIMUM_PROBABILTY 参数创建两个不同的值。
MINIMUM_PROBABILTY 是一个 Microsoft 关联算法参数,它通过指定规则必须具有的最小概率来帮助确定挖掘模型将包含的规则数。 例如,如果此值设置为 0.4,则表明仅当规则所描述的产品组合具有至少 40% 的发生概率时才可生成此规则。
你将在后面的课程中查看更改 MINIMUM_PROBABILTY 参数的效果。
ALTER MINING STRUCTURE 语句
若要将包含嵌套表的挖掘模型添加到挖掘结构,请使用 ALTER MINING STRUCTURE (DMX) 语句。 可以将语句中的代码分为下列几部分:
标识挖掘结构
命名挖掘模型
定义键列
定义输入列和可预测列
定义嵌套表列
标识算法和参数更改
下面是 ALTER MINING STRUCTURE
语句的一般示例,它将包含嵌套表列的挖掘模型添加到结构中:
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
上述代码的第一行标识要向其添加挖掘模型的现有挖掘结构:
ALTER MINING STRUCTURE [<mining structure name>]
代码的第二行对将要添加到挖掘结构中的挖掘模型进行命名:
ADD MINING MODEL [<mining model name>]
有关在 DMX) (数据挖掘扩展中命名对象的信息,请参阅 DMX) 标识符 (。
代码的接下来的各行对挖掘结构中将由挖掘模型使用的各列进行定义:
[<key column>],
<mining model columns> <usage>,
您可以只使用挖掘结构中已有的列。
挖掘模型列的列表中的第一列必须为挖掘结构中的键列。 但是,无需在键列后键入 KEY
即可指定用法。 这是因为您在创建挖掘结构时已将列定义为键。
其他行指定新挖掘模型中的列的用法。 可使用以下语法指定挖掘模型中的列用于预测:
<column name> PREDICT,
如果没有指定用法,则不必在列表中包含数据挖掘结构列。 由引用的数据挖掘结构所使用的所有列可自动用于基于该结构的挖掘模型中。 但是,除非您指定用法,否则模型不会将这些列用于定型。
代码的最后一行定义将用于生成挖掘模型的算法和算法参数。
) USING <algorithm>( <algorithm parameters> )
课程任务
在本课中,你将执行以下任务:
使用默认的概率向结构中添加关联挖掘模型
使用修改的概率向结构中添加关联挖掘模型
使用默认的 MINIMUM_PROBABILITY 向结构中添加关联挖掘模型
第一个任务是使用 MINIMUM_PROBABILITY 的默认值,根据 Microsoft 关联算法向市场篮挖掘结构添加新 的挖掘模型。
添加关联挖掘模型
在“对象资源管理器”中,右键单击 Analysis Services 的实例,指向“新建查询”,然后单击“DMX”。
将打开查询编辑器,其中包含一个新的空白查询。
注意
若要针对特定 Analysis Services 数据库创建 DMX 查询,请右键单击数据库而不是实例。
将
ALTER MINING STRUCTURE
语句的一般示例复制到空白查询中。将
<mining structure name>
替换为:
[Market Basket]
将
<mining model name>
替换为:
[Default Association]
将
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
替换为:
OrderNumber, [Products] PREDICT ( [Model] )
在本例中,
[Products]
表已被指定为可预测列.
。此外,[Model]
列包含于嵌套表列的列表中,原因是它是嵌套表的键列。注意
请注意,嵌套键不同于事例键。 事例键是事例的唯一标识符,而嵌套键是您想要建模的属性。
将
USING <algorithm>( <algorithm parameters> )
替换为:
Using Microsoft_Association_Rules
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules
在“ 文件 ”菜单上,单击“ 将 DMXQuery1.dmx 另存为”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并将文件
Default_Association_Model.dmx
命名为 。在工具栏上,单击“ 执行 ”按钮。
向结构中添加关联挖掘模型并更改默认的 MINIMUM_PROBABILITY
下一个任务是基于 Microsoft 关联算法向市场篮挖掘结构添加新的挖掘模型,并将 MINIMUM_PROBABILITY 的默认值更改为 0.01。 更改 参数将导致 Microsoft 关联算法创建更多规则。
添加关联挖掘模型
在“对象资源管理器”中,右键单击 Analysis Services 的实例,指向“新建查询”,然后单击“DMX”。
将打开查询编辑器,其中包含一个新的空白查询。
将
ALTER MINING STRUCTURE
语句的一般示例复制到空白查询中。将
<mining structure name>
替换为:
Market Basket
将
<mining model name>
替换为:
[Modified Association]
将
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
替换为:
OrderNumber, [Products] PREDICT ( [Model] )
在本例中,
[Products]
表已被指定为可预测列。 此外,[MODEL]
列包含于列表中,原因在于它是嵌套表的键列。将
USING <algorithm>( <algorithm parameters> )
替换为:
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
在“ 文件 ”菜单上,单击“ 将 DMXQuery1.dmx 另存为”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并将文件
Modified Association_Model.dmx
命名为 。在工具栏上,单击“ 执行 ”按钮。
在下一课中,您将处理市场篮挖掘结构及其关联的挖掘模型。