创建数据挖掘模型
数据建模是数据挖掘的步骤,通过对数据应用 算法 来构建模式和趋势。 之后,可以使用这些模式进行分析或预测。
Office 数据挖掘外接程序通过向导(使用这些向导可轻松地创建模型)支持数据挖掘。 这些向导对数据进行分析、标识关联、计算所有变量的统计重要性,以及自动选择最佳模型。
尽管此功能与 SQL Server Analysis Services 提供的数据挖掘工具一样强大,SQL Server Data Tools (SSDT) ,但向导和熟悉的 Excel 界面的组合使得创建、修改和使用数据挖掘变得容易。
高级(数据挖掘)
通过高级向导,可以使用 SQL Server Analysis Services 中的数据挖掘算法之一,基于 Excel 中存储的数据创建新的数据挖掘模型。
创建挖掘结构
创建挖掘结构向导可帮助您生成新的数据挖掘结构并将其用作多个挖掘模型的基础。 通过该向导,可以选择保留要用作测试集的数据部分,因此,您可以按照一致的测试标准来对所有使用相同数据的模型进行评估。
将模型添加到结构
通过将模型添加到结构向导,可以选择现有的数据挖掘结构,并为该结构创建新的数据挖掘模型。 可以向结构中添加多个挖掘模型、更改参数或选择不同的数据挖掘算法,并自定义输出。
分析关键影响因素(分析)
您选择感兴趣的列或输出值,然后算法将分析所有输入数据,以便标识对目标影响最大的因素。 或者,您可以创建比较任何两个值的报告,以便可以看到影响因素是如何变化的。
分析关键影响因素工具使用 Microsoft Naïve Bayes 算法。
关联(数据挖掘)
“关联”向导生成一个关联模型,用于检测出现在多个交易中的项之间的关联:例如,在市场篮分析中。
分类(数据挖掘)
分类向导生成一个分类模型,用于分析导致目标结果的因素。 您可以将多个算法用于此向导,包括决策树、Naïve Bayes 和神经网络。
聚类分析(数据挖掘)
群集向导生成一个聚类分析模型,用于检测具有相似特征的行组。 聚类 (有时称为 分段) 是一种无监督学习技术,在尝试了解新数据中的模式和分组时非常有用。
Microsoft 聚类分析算法支持 K-means 聚类分析和期望最大化 (EM) 聚类分析的若干变化形式。
检测类别(分析)
使用“检测类别”工具可以添加任何数据集并应用聚类分析来查找数据分组。 它可用于查找相似之处和创建组以进一步分析。
检测类别工具使用 Microsoft 聚类分析算法。
估计(数据挖掘)
估计向导生成一个估计模型,它提取数据模式并使用这些模式来预测连续的数字、日期或时间值。 它使用 Microsoft 决策树算法。
从示例填充(分析)
“ 从示例填充” 工具可帮助你对缺失值进行插补。 您提供缺失值应该是什么的一些示例,该工具将基于表中的所有数据生成模式,然后基于数据中的模式建议新值。
“ 从示例填充” 工具使用 Microsoft 逻辑回归算法。
预测(分析)
预测工具获取随时间变化的数据,并预测未来值。
预测工具使用 Microsoft 时序算法。
预测(数据挖掘)
“预测”向导生成一个预测模型,该模型检测一系列单元格中的模式,然后预测其他值。
突出显示异常值(分析)
突出显示异常工具分析数据表中的模式,并查找不符合该模式的行和值。 然后,您可以查看和更正它们并重新运行模型,或者对值进行标记以便以后执行操作。
突出显示异常工具使用 Microsoft 聚类分析算法。
预测计算器(分析)
该工具创建对导致目标结果的因素进行分析的模型,然后基于从这些模式导出的条件预测任何新输入的结果。它还生成一个交互式的决策工作表,使您可以轻松地对新输入评分。 您还可以创建评分工作表的打印版本,以供脱机使用。
预测计算器工具使用 Microsoft 逻辑回归算法。
应用场景:目标查找(分析)
在 “目标查找 ”工具中,指定目标值,该工具标识为满足该目标而必须更改的基础因素。 例如,如果您知道必须将电话满意度增加 20%,则可以要求模型预测应进行变化以便实现该目标的因素。
目标搜寻工具使用 Microsoft 逻辑回归算法。
详细信息
应用场景:“假设”应用场景(分析)
What-If 分析工具补充了目标查找工具。 使用此工具,您输入要更改的值,并且模型将预测该更改是否足以实现预期结果。 例如,您可以要求该模型推断再增加一名电话接线员是否可以将客户满意度增加一个百分点。
What-If 工具使用 Microsoft 逻辑回归算法。
购物篮分析(分析)
购物篮分析工具创建经常一起购买的产品组,以识别可用于交叉销售或向上销售的模式。 它还基于相关产品捆绑的价格和成本生成报告,以便帮助进行决策。
您还可以将该工具用于经常一起发生的事件、导致诊断的因素或者任何其他可能原因和结果组。
购物篮分析工具使用 Microsoft 关联算法。
另请参阅
浏览和清除数据
验证模型和使用模型进行预测(Excel 数据挖掘外接程序)
部署和缩放挖掘模型(Excel 数据挖掘外接程序)