数据挖掘基础教程

欢迎阅读 Microsoft Analysis Services 基本数据挖掘教程。 Microsoft SQL Server 提供了用于创建数据挖掘模型和进行预测的集成环境。 在本教程中,您将完成一个用于目标邮递活动的方案,在此方案中您使用计算机学习来分析和预测客户购买行为。 本教程说明了如何使用三种最重要的数据挖掘算法:聚类、决策树和 Naive Bayes。 你还将了解如何使用挖掘模型查看器分析发现结果,以及如何使用 Microsoft SQL Server Analysis Services 中包含的数据挖掘工具创建预测和准确性图表。 虚构的公司 Adventure Works Cycles 用于所有示例。

如果熟悉使用数据挖掘工具,建议还完成 中间数据挖掘教程 (Analysis Services - 数据挖掘) 。 这些课演示如何使用预测、市场篮分析、时序、关联模型、嵌套表、顺序分析和聚类分析。

教程方案

在本教程中,你是 Adventure Works Cycles 的员工,他的任务是基于历史购买详细了解公司客户,然后使用该历史数据进行可用于营销的预测。 公司以前从未进行过数据挖掘,因此您必须创建一个专门用于数据挖掘的新数据库并建立几个数据挖掘模型。

学习内容

本教程将讲述如何创建和使用数种不同类型的计算机学习方法。 您还将学习如何创建挖掘模型的副本以及如何将筛选器应用到输入数据以获得不同结果。 之后,您可以使用提升图比较两个模型的结果。 最后,您将使用钻取功能从基础挖掘结构检索其他数据。

Microsoft Analysis Services 数据挖掘包括以下功能,可帮助你轻松开发和比较多个预测模型,然后对结果执行操作:

  • 维持测试集 -创建挖掘结构时,现在可以将挖掘结构中的数据划分为训练集和测试集。 这让您能够在类似的数据集上测试模型,以及比较相关模型的准确性。

  • 挖掘模型筛选器 -现在可以将筛选器附加到挖掘模型,并在训练和测试期间应用筛选器。 这让您能够轻松地在不同的数据子集上生成相关模型。

  • 钻取到结构事例和结构列 - 现在可以轻松地从挖掘模型中的常规模式移动到数据源中的可操作详细信息。

本教程分为以下几课:

第 1 课:准备 Analysis Services 数据库(数据挖掘基础教程)
在本课中,你将了解如何创建新的 Analysis Services 数据库、添加数据源和数据源视图,以及如何准备用于数据挖掘的新数据库。

第 2 课:生成 Targeted Mailing 结构(数据挖掘基础教程)
在本课中,您将学习如何创建可用作目标邮寄方案一部分的挖掘模型结构。

第 3 课:添加和处理模型
在本课中,您将学习如何向结构中添加模型。 您创建的模型是用如下算法生成的:

  • Microsoft 决策树

  • Microsoft 聚类分析

  • Microsoft Naive Bayes

第 4 课:浏览 Targeted Mailing 模型(数据挖掘基础教程)
在本课中,您将学习如何使用查看器浏览和解释在每个模型中发现的内容。

第 5 课:测试模型(数据挖掘基础教程)
在本课中,您将创建某个 Targeted Mailing 模型的副本,添加一个挖掘模型筛选器以将定型数据限制在特定客户集,然后评估该模型的可行性。

第 6 课:创建和使用预测(数据挖掘基础教程)
在本数据挖掘基础教程的最后一课中,您将使用该模型预测哪些客户最有可能购买自行车。 随后,您将钻取到基础事例以获取联系信息。

要求

请确保已安装下列软件:

  • Microsoft SQL Server 2014

  • 多维模式下的 Microsoft SQL Server Analysis Services

  • AdventureWorksDW2012 数据库。

为了增强安全性,示例数据库未随SQL Server一起安装。 若要为 Microsoft SQL Server安装官方数据库,请访问 Microsoft SQL 示例数据库页并选择“SQL Server 2014”。

注意

在完成教程时,如果将 “下一主题 ”和“ 上一主题 ”按钮添加到文档查看器工具栏,你可能会发现在步骤之间来回移动会更容易。

另请参阅

数据挖掘解决方案
挖掘模型任务和操作指南
使用 DMX 创建和查询数据挖掘模型:教程(Analysis Services - 数据挖掘)