Excel 数据挖掘客户端(SQL Server 数据挖掘外接程序)
Excel 数据挖掘客户端是一组工具,通过这些工具,可执行常用的数据挖掘任务,包括从数据清理到建模和预测查询。 可使用 Excel 表或范围中的数据,也可访问外部数据源。
-
将数据加载到 Excel,清理数据,检查是否存在离群值,然后创建统计摘要。 还可执行不同类型的抽样、分析数据和使用外部数据测试模型。 数据挖掘客户端是准备数据以供分析的最简单方法,不需要复杂的脚本或 ETL 进程。
-
这些工具针对已知的、经过了实践检验的数据挖掘算法提供向导界面,这些算法包括聚类分析(K-means 和 EM)、关联分析、时序分析和决策树。 通过每个向导的高级建模选项,可选择不同的算法(如 Naïve Bayes 或神经网络)和自定义聚类种子或初始抽样大小等行为。
所有数据挖掘算法都托管在 Analysis Services 的一个实例中,使你能够更强大地构建复杂模型。
-
数据挖掘客户端提供用于测试模型的行业标准工具,包括提升图和交叉验证。 所提供的向导使检验数据集的有效性及其准确性变得轻而易举。 查询向导生成查询以使用模型进行预测和评分。
-
大多数工具生成的图表都可直接保存到 Excel。 使用 Excel 中的浏览模型 (SQL Server数据挖掘外接程序) 工具浏览模型。
-
Excel 数据挖掘客户端与服务器之间保持一个活动连接,这样,您可以将数据挖掘模型保存到服务器以便用于进一步的测试,或者部署到生产服务器以便获得更高的可伸缩性。
使用数据
“数据准备”组包含以下向导,可帮助你查看和清理数据,为数据挖掘任务做准备。 大多数向导还允许您将数据划分为定型集和测试集。
浏览数据(SQL Server 数据挖掘外接程序)
为生成和存储模型,外接程序支持以下数据连接:
连接到 Analysis Services 服务器,用于存储和处理模型。
与外部数据源的可选连接。 可以使用可定义为 Analysis Services 数据源的任何类型的数据生成模型,也可以仅使用 Excel 中已有的数据。
浏览数据(SQL Server 数据挖掘外接程序)
浏览 数据 向导通过绘制所选列的分布和值(一次一个)来帮助你了解数据表中的数据类型和数量。
示例数据(SQL Server 数据挖掘外接程序)
为模型的定型和测试创建正确类型的数据是数据挖掘的一个重要部分,但如果没有适当的工具,将非常单调乏味。 借助 “示例数据 ”向导,可以轻松地将用于模型的数据划分为两组,一组用于生成模型,另一组用于测试模型。 您可以使用随机抽样或过度抽样。
预测计算器(Excel 表分析工具)
“删除离群值”向导提供了多种工具来识别和适当处理离群值。 该向导显示值的分布以及离群值与其他数据的关系,并且允许您决定是删除还是更改离群值。
预测计算器(Excel 表分析工具)
重新标记向导可帮助你为数据创建新标签,以便更轻松地理解分析结果。 例如,您可以使用更具说明性的名称或从列表中选择代表值,来重新命名数据区域。
生成模型和分析
工具栏的 “数据建模 ”部分中的选项使你可以从数据派生模式;基于属性对数据行进行分组,或浏览关联。 此工具功能区中的向导基于 Analysis Services 中提供的强大数据挖掘算法。 与 Excel 表分析工具中的类似工具不同,使用这些向导可以自定义算法的行为并使用多种数据源。
分类向导(Excel 数据挖掘外接程序)
分类向导可帮助你基于 Excel 表、Excel 区域或外部数据源中的现有数据生成分类模型。 分类模型提取数据中表示相似性的模式,并帮助您基于值的分组进行预测。 例如,分类模型可用于根据收入或消费模式来预测风险。
分类向导支持使用以下 Microsoft 数据挖掘算法:决策树算法、逻辑回归、Naïve Bayes、神经网络。
估计向导(Excel 数据挖掘外接程序)
“估算”向导可帮助你创建估算模型。 估计模型从数据中提取数据模式,并且使用这些模式来预测数字结果,例如货币、销售金额、日期或时间。
“估算”向导使用以下 Microsoft 数据挖掘算法:决策树、线性回归、逻辑回归和神经网络。
分析关键影响因素(Excel 表分析工具)
聚类分析向导帮助您生成聚类分析模型。 聚类分析模型检测各组具有相似特征的行。 此向导对于检测各种类型数据中的模式非常有用。
群集向导使用 Microsoft 聚类分析算法,其中包括 K 均值和 EM。
关联向导(Excel 数据挖掘客户端)
“关联”向导可帮助你使用 Microsoft 关联规则算法创建数据挖掘模型,该算法可检测经常发生的项或事件。 此类关联模型对于提出建议尤为有用。
“关联”向导使用 Microsoft 关联规则算法。
预测向导(Excel 数据挖掘外接程序)
“预测”向导可帮助你预测时序中的值。 通常,您在预测中使用的数据包含某种类型的时序(可以是日期戳或某个序列 ID),并且您使用该时序来派生模式以便用于预测将来值。
“预测”向导使用 Microsoft 时序算法。
高级建模(Excel 数据挖掘外接程序)
是否已熟悉数据挖掘? 可以使用 高级 数据建模选项创建自定义数据结构,并使用未包含在其他工具和向导中的自定义项生成模型。
测试、查询和验证模型
使用 “准确性和验证” 工具栏上的向导,使用行业标准测试来验证模型的准确性,并评估用于创建模型的数据集的可行性。
分析关键影响因素(Excel 表分析工具)
通过生成提升图或散点图来评估数据挖掘模型的性能。
分类矩阵(SQL Server 数据挖掘外接程序)
通过创建基于模型的精确预测和不精确预测的汇总图表,帮助您评估分类模型的性能。
利润图(SQL Server 数据挖掘外接程序)
通过将预测的准确性与基于预测所采取行动的成本和效益进行绘图,帮助您了解数据挖掘模型的影响。
交叉验证(SQL Server 数据挖掘外接程序)
用于创建报表,汇总模型在数据集的多个子集间的准确性,以此确定模型的稳定程度。
您还可以将 Excel 表中的数据作为针对存储在服务器上的挖掘模型进行的预测查询的输入。
查询(SQL Server 数据挖掘外接程序)
查询向导可帮助你根据现有数据挖掘模型创建预测。
高级数据挖掘查询编辑器
对于高级用户,此工具提供针对 DMX 的拖放界面。 您可以轻松地创建预测查询或新模型,而不必担心语法。
查看模型
所创建的模型将自动打开以供浏览。 但是,也可在服务器上浏览模型并生成新的可视化效果。 使用 Visio 形状 将模型图导出到可自定义画布。
在 Excel 中浏览模型(SQL Server 数据挖掘外接程序)
使用对各种模型类型自定义的交互式图形查看您已创建的模型。
记录挖掘模型(Excel 数据挖掘外接程序)
此向导将创建提供有关模型的数据集和元数据的统计摘要的报表,以便帮助进行调查和解释。
管理、记录和部署
这些工具帮助您连接到某一数据挖掘服务器,管理和导出模型,以及监视数据挖掘活动。
管理模型(SQL Server 数据挖掘外接程序)
如果具有所需的权限,您可以在不离开 Excel 的情况下删除、修改、重命名或处理现有挖掘模型和结构。
跟踪(Excel 数据挖掘客户端)
单击“跟踪”以查看 Excel 客户端与SQL Server服务器之间交互的持续捕获。 所有活动都作为 DMX 或 XMLA 语句存储,这样便于排除数据挖掘会话中的故障,也便于保存信息以备日后使用。
连接到数据挖掘服务器
若要使用 Excel 作为客户端进行数据挖掘,必须建立与 Analysis Services 实例的连接。 通过连接可以访问 Analysis Services 引擎。 如果有相应权限,您还可以通过该连接存储已发现的所有模式,并修改现有数据挖掘对象。
“ 连接” 工具栏提供用于管理与 Analysis Services 实例的连接的向导。 必须定义与 Analysis Services 实例的连接才能使用数据挖掘工具和算法。 您可以在安装外接程序时创建连接,也可以在以后添加连接。
入门
单击“入门”按钮可启动配置向导,该向导将引导你完成创建与 Analysis Services 实例的连接并获取执行数据挖掘所需的权限的过程。
帮助
“ 帮助 ”下拉菜单提供指向联机帮助、网站和配置向导的链接,可帮助你完成设置和启动数据挖掘。
该“帮助”页还链接到在线资源,包括用于外接程序的帮助,以及附加的视频、演示和示例。