数据挖掘中级教程(Analysis Services - 数据挖掘)

Microsoft Analysis Services 提供用于创建和使用数据挖掘模型的集成环境。 您可以方便地绑定到数据源、针对同一个数据创建和测试多个模型并部署要用于进行预测分析的模型。

在基本数据挖掘教程中,你了解了如何使用 SQL Server Data Tools (SSDT) 创建数据挖掘解决方案,并构建了三个模型来支持目标邮件活动,用于分析客户购买行为和定位潜在买家。

本中级教程基于这些经验而构建,其中介绍了几个新方案(包括预测和市场篮分析等常见业务要求)。 您将学习如何创建时序模型、关联模型以及顺序分析和聚类分析模型。 最后,您将学习如何使用神经网络了解数据相关性,以及使用逻辑回归进行预测。

这些课程是相互独立的,可以单独完成。

若要完成以下教程,应熟悉数据挖掘工具和基本数据挖掘教程中介绍的挖掘模型查看器。

所有方案都使用 AdventureWorksDW2012 数据源,但你将为不同的方案创建不同的数据源视图。 只要您是首先创建数据源,就可以按任何顺序做练习。

课程方案

在成功完成目标邮寄活动之后,系统已经要求您利用自己的数据挖掘知识来开发几个要用于进行业务规划的新模型。 其中包括以下任务:

  • 预测: 你将创建一个 时序 模型,用于预测全球不同区域的产品销售情况。 你将为每个区域开发单独的模型,并了解如何使用 交叉预测

  • 市场篮子分析: 你将创建一个 关联模型,用于分析在访问 Adventure Works Cycles 电子商务网站期间购买的产品分组。 根据此市场篮模型,可以向客户推荐产品。

  • 序列分析:聚类分析模型构建序列,以分析客户购买产品的顺序。 您可以基于这个模型规划对网站设计或新产品套餐进行的更改。

  • 因素分析: 使用 神经网络 模型来探索呼叫中心数据中服务质量差的可能原因。 根据来自初步模型的见解,你将创建 一个逻辑回归模型 来预测改善客户体验的策略。

学习内容

本教程将讲述如何创建和使用多种类型的数据挖掘算法。 本教程分为以下几课:

第 1 课:创建中级数据挖掘解决方案(数据挖掘中级教程)
在本课中,您将基于 AdventureWorksDW2012 数据库创建一个新项目,以支持多个新的数据源视图和更多挖掘模型。

第 2 课:生成预测方案(数据挖掘中级教程)
在本课中,您将创建一个可用作预测方案一部分的挖掘模型, 你还将探索使用 Microsoft 时序算法生成的挖掘模型。

您将为每个地区生成单独的模型,而且还生成一个可用于进行交叉预测的通用模型。

第 3 课:生成市场篮方案(数据挖掘中级教程)
在本课中,您将添加一个新的数据源视图,并学习如何处理嵌套表及其键。 您将基于此数据创建一个可用作市场篮方案一部分的挖掘模型。 你还将探索使用 Microsoft 关联算法生成的挖掘模型。

第 4 课:生成顺序分析和聚类分析方案(数据挖掘中级教程)
在本课中,您将创建一个可用作顺序分析和聚类分析方案一部分的挖掘模型, 你还将了解如何探索使用 Microsoft 顺序聚类分析算法生成的挖掘模型。

第 5 课:生成神经网络模型和逻辑回归模型(数据挖掘中级教程)
在本课中,您将使用 Microsoft 神经网络和 Microsoft 逻辑回归算法创建若干相关的挖掘模型。 您还将学习如何使用数据源视图来基于模型浏览数据。

要求

请确保已安装下列软件:

  • Microsoft SQL Server 2014

  • Microsoft SQL Server Analysis Services

  • SQL Server AdventureWorksDW2012 数据库。

为了增强安全性,默认情况下将不安装该示例数据库。 若要安装 Microsoft SQL Server的官方数据库,请访问 Microsoft SQL 示例数据库页并选择相应版本的示例数据库。

另请参阅

数据挖掘基础教程
自行车购买者 DMX 教程
市场篮 DMX 教程