第 1 课:创建市场篮挖掘模型
在本课中,你将创建一个挖掘结构,用于预测客户同时购买的 Adventure Works Cycles 产品。 如果不熟悉挖掘结构及其在数据挖掘中的角色,请参阅 挖掘结构 (Analysis Services - 数据挖掘) 。
在本课中创建的关联挖掘结构支持添加基于 Microsoft 关联算法的挖掘模型。 在后面的课程中,您将使用挖掘模型来预测客户要同时购买的产品类型,这称为市场篮分析。 例如,您可能会发现客户要同时购买山地自行车、自行车轮胎和头盔。
在本课中,挖掘结构是使用嵌套表定义的。 使用嵌套表是因为将由结构定义的数据域分别包含在两个不同的源表中。 有关嵌套表的详细信息,请参阅嵌套 表 (Analysis Services - 数据挖掘) 。
CREATE MINING STRUCTURE 语句
若要创建包含嵌套表的挖掘结构,请使用 CREATE MINING STRUCTURE (DMX) 语句。 可以将语句中的代码分为下列几部分:
命名结构
定义键列
定义挖掘列
定义嵌套表列
下面是 CREATE MINING STRUCTURE 语句的一般示例:
CREATE MINING STRUCTURE [<Mining Structure Name>]
(
<key column>,
<mining structure columns>,
<table columns>
( <nested key column>,
<nested mining structure columns> )
)
代码的第一行定义了结构的名称:
CREATE MINING STRUCTURE [Mining Structure Name]
有关在 DMX 中命名对象的信息,请参阅标识符 (DMX) 。
代码的下一行定义了挖掘结构的键列,它唯一标识源数据中的实体:
<key column>
代码的下一行用于定义与挖掘结构关联的挖掘模型所使用的挖掘列:
<mining structure columns>
代码中接下来几行定义了嵌套表列:
<table columns>
( <nested key column>,
<nested mining structure columns> )
有关可以定义的挖掘结构列的类型的信息,请参阅 挖掘结构列。
注意
默认情况下,SQL Server Data Tools (SSDT) 为每个挖掘结构创建 30% 的维持数据集;但是,使用 DMX 创建挖掘结构时,必须根据需要手动添加维持数据集。
课程任务
在本课中,你将执行以下任务:
创建新的空白查询
更改查询以创建挖掘结构
执行查询
创建查询
第一步是连接到 Analysis Services 实例并在 SQL Server Management Studio 中创建新的 DMX 查询。
在 SQL Server Management Studio 中创建一个新的 DMX 查询
打开 SQL Server Management Studio。
在“ 连接到服务器 ”对话框中,对于“ 服务器类型”,选择“ Analysis Services”。 在 “服务器名称”中,键入
LocalHost
或要在本课中连接到的 Analysis Services 实例的名称。 单击“连接” 。在“对象资源管理器”中,右键单击 Analysis Services 实例,指向“新建查询”,然后单击“DMX”。
将打开查询编辑器,其中包含一个新的空白查询。
更改查询
下一步是修改上述 CREATE MINING STRUCTURE 语句以创建市场篮挖掘结构。
自定义 CREATE MINING STRUCTURE 语句
在 查询编辑器中,将 CREATE MINING STRUCTURE 语句的泛型示例复制到空白查询中。
将
[mining structure name]
替换为:
[Market Basket]
将
<key column>
替换为:
OrderNumber TEXT KEY
将
<table columns> ( <nested key column>, <nested mining structure columns> )
替换为:
[Products] TABLE ( [Model] TEXT KEY )
TEXT KEY 语言指定 Model 列为嵌套表的键列。
现在,完整的挖掘结构语句应该如下所示:
CREATE MINING STRUCTURE [Market Basket] ( OrderNumber TEXT KEY, [Products] TABLE ( [Model] TEXT KEY ) )
在“ 文件 ”菜单上,单击“ 将 DMXQuery1.dmx 另存为”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并将文件
Market Basket Structure.dmx
命名为 。
执行查询
最后一步是执行查询。 创建并保存查询后,需要执行该查询(即,需要执行该语句)以便在服务器中创建挖掘结构。 有关在 查询编辑器 中执行查询的详细信息,请参阅数据库引擎 查询编辑器 (SQL Server Management Studio) 。
执行查询
在查询编辑器工具栏上,单击“执行”。
语句执行完成后,查询的状态将显示在查询编辑器底部的“消息”选项卡中。 所显示的消息应为:
Executing the query Execution complete
服务器上现在存在名为 “市场篮 ”的新结构。
在下一课中,您将向刚才创建的市场篮挖掘结构中添加挖掘模型。