创建目标邮件挖掘模型结构(数据挖掘基础教程)
适用于: SQL Server 2016 Preview
要创建目标邮件方案,第一步是使用 SQL Server Data Tools (SSDT) 中的数据挖掘向导创建新的挖掘结构和决策树挖掘模型。
在本任务中您将设置新的挖掘结构,并添加初始挖掘模型基于 Microsoft 决策树算法。 若要创建此结构,需要首先选择表和视图,然后标识将用于定型的列和将用于测试的列。
创建用于目标邮件方案的挖掘结构
在解决方案资源管理器,右键单击 挖掘结构 ,然后选择 新建挖掘结构 以启动数据挖掘向导。
在 “欢迎使用数据挖掘向导” 页上,单击 “下一步”。
在 选择定义方法 页上,确认 从现有关系数据库或数据仓库 已选择,然后单击 下一步。
在 创建数据挖掘结构 页面上,在 您想要使用何种数据挖掘技术?, ,选择 Microsoft 决策树。
备注
如果收到警告,告知无法找到数据挖掘算法,则项目属性可能配置不正确。 当项目尝试从 Analysis Services 服务器检索数据挖掘算法列表却找不到服务器时,就会出现此警告。 默认情况下, SQL Server Data Tools 将使用 localhost 与服务器。 如果要使用其他实例或命名实例,则必须更改项目属性。 有关详细信息,请参阅 创建 Analysis Services 项目 (数据挖掘基础教程 )。单击“下一步” 。
在 选择数据源视图 页上,在 可用数据源视图 窗格中,选择 Targeted Mailing。 您可以单击 浏览 以数据源视图中查看的表,然后单击 关闭 以返回到向导。
单击“下一步” 。
在 指定表类型 页上,选择中的复选框 用例 vTargetMail 以将其用作事例表中,然后单击列 下一步。 稍后您将使用 ProspectiveBuyer 表进行测试,不过现在可以忽略它。
在 指定定型数据 页上,您将找出至少一个可预测列、 一个键列,以及一个输入为您的模型的列。 选中复选框在 可预测 中的列 BikeBuyer 行。
备注
请注意窗口底部的警告。 您将无法以导航到下一个页面,直到您选择至少一个 输入 和一个 可预测 列。单击 建议 若要打开 提供相关列建议 对话框。
建议 只要至少一个可预测属性具有选中启用按钮。 提供相关列建议 对话框列出最紧密相关的可预测列的列,并使用可预测属性及其关联的排序属性。 显著相关的列(置信度高于 95%)将被自动选中以添加到模型中。
查看建议,,然后单击 取消 toignore 建议。
备注
如果您单击 确定, ,所有列出的建议将被标记为在向导中的输入列。 如果仅同意其中的某些建议,则必须手动更改值。验证中的复选框 密钥 中选择列 CustomerKey 行。
备注
如果数据源视图中的源表表示一个键,则数据挖掘向导将自动选择该列作为模型的键。选择中的复选框 输入 以下行中的列。 可通过下面的方法来同时选中多个列:突出显示一系列单元格,然后在按住 Ctrl 的同时选中一个复选框。
年龄
CommuteDistance
EnglishEducation
EnglishOccupation
性别
GeographyKey
HouseOwnerFlag
MaritalStatus
NumberCarsOwned
NumberChildrenAtHome
地区
TotalChildren
YearlyIncome
在该页的最左侧的列中,选中以下行中的复选框。
AddressLine1
AddressLine2
DateFirstPurchase
EmailAddress
FirstName
LastName
确保这些行仅选择了左侧列中的复选标记。 这些列将添加到结构中,但不会包含在模型中。 但是,模型生成后,它们将可用于钻取和测试。 有关钻取详细信息,请参阅 钻取查询 ( 数据挖掘 )
单击“下一步” 。