创建目标邮件挖掘模型结构(数据挖掘基础教程)

 

适用于: SQL Server 2016 Preview

要创建目标邮件方案,第一步是使用 SQL Server Data Tools (SSDT) 中的数据挖掘向导创建新的挖掘结构和决策树挖掘模型。

在本任务中您将设置新的挖掘结构,并添加初始挖掘模型基于 Microsoft 决策树算法。 若要创建此结构,需要首先选择表和视图,然后标识将用于定型的列和将用于测试的列。

创建用于目标邮件方案的挖掘结构

  1. 在解决方案资源管理器,右键单击 挖掘结构 ,然后选择 新建挖掘结构 以启动数据挖掘向导。

  2. “欢迎使用数据挖掘向导” 页上,单击 “下一步”

  3. 选择定义方法 页上,确认 从现有关系数据库或数据仓库 已选择,然后单击 下一步

  4. 创建数据挖掘结构 页面上,在 您想要使用何种数据挖掘技术?, ,选择 Microsoft 决策树

    备注


    如果收到警告,告知无法找到数据挖掘算法,则项目属性可能配置不正确。 当项目尝试从 Analysis Services 服务器检索数据挖掘算法列表却找不到服务器时,就会出现此警告。 默认情况下, SQL Server Data Tools 将使用 localhost 与服务器。 如果要使用其他实例或命名实例,则必须更改项目属性。 有关详细信息,请参阅 创建 Analysis Services 项目 (数据挖掘基础教程 )

  5. 单击“下一步” 。

  6. 选择数据源视图 页上,在 可用数据源视图 窗格中,选择 Targeted Mailing。 您可以单击 浏览 以数据源视图中查看的表,然后单击 关闭 以返回到向导。

  7. 单击“下一步” 。

  8. 指定表类型 页上,选择中的复选框 用例 vTargetMail 以将其用作事例表中,然后单击列 下一步。 稍后您将使用 ProspectiveBuyer 表进行测试,不过现在可以忽略它。

  9. 指定定型数据 页上,您将找出至少一个可预测列、 一个键列,以及一个输入为您的模型的列。 选中复选框在 可预测 中的列 BikeBuyer 行。

    备注


    请注意窗口底部的警告。 您将无法以导航到下一个页面,直到您选择至少一个 输入 和一个 可预测 列。

  10. 单击 建议 若要打开 提供相关列建议 对话框。

    建议 只要至少一个可预测属性具有选中启用按钮。 提供相关列建议 对话框列出最紧密相关的可预测列的列,并使用可预测属性及其关联的排序属性。 显著相关的列(置信度高于 95%)将被自动选中以添加到模型中。

    查看建议,,然后单击 取消 toignore 建议。

    备注


    如果您单击 确定, ,所有列出的建议将被标记为在向导中的输入列。 如果仅同意其中的某些建议,则必须手动更改值。

  11. 验证中的复选框 密钥 中选择列 CustomerKey 行。

    备注


    如果数据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。

  12. 选择中的复选框 输入 以下行中的列。 可通过下面的方法来同时选中多个列:突出显示一系列单元格,然后在按住 Ctrl 的同时选中一个复选框。

    • 年龄

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • 性别

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • 地区

    • TotalChildren

    • YearlyIncome

  13. 在该页的最左侧的列中,选中以下行中的复选框。

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    确保这些行仅选择了左侧列中的复选标记。 这些列将添加到结构中,但不会包含在模型中。 但是,模型生成后,它们将可用于钻取和测试。 有关钻取详细信息,请参阅 钻取查询 ( 数据挖掘 )

  14. 单击“下一步” 。

课程中的下一个任务

指定的数据类型和内容类型和 #40;数据挖掘基础教程 )

另请参阅

指定表类型(数据挖掘向导)
数据挖掘设计器
Microsoft 决策树算法