记录挖掘模型(Excel 数据挖掘外接程序)
文档模型向导会创建一个报表,用于提供有关已创建的挖掘模型的有用信息。 通过记录创建的模型,不但可以跟踪用于生成模型的数据的源,获取有关模型处理时间的其他信息,还可以跟踪影响模型结果的参数更改。
使用文档模型向导
单击“ 数据挖掘 ”选项卡。
在 “模型使用情况” 组中,单击“ 文档模型”。
在 “选择模型 ”对话框中,选择要报告的模型,然后单击“ 下一步”。 必须针对要记录的每个模型单独运行文档模型向导。
在 “选择文档详细信息 ”对话框中,选择两个选项之一: “完整信息 ”或 “摘要信息”。
单击“完成”。
向导会自动创建一个包含指定报表的新工作表,标题为“模型文档”
了解报表
创建记录数据挖掘模型的报表时,可以创建包含基本信息(模型的名称和说明)的摘要,或者也可以创建包含基础结构详细信息和挖掘模型高级信息的完整报表。
会根据创建模型所使用的算法,提供有不同类型的信息。 例如,在关联模型中,您可能对了解生成的项集数和规则数更感兴趣。 在聚类分析模型中,可能会对分类数更感兴趣。
下表列出了各选项以及报表中提供的每个选项的信息。
注意
默认情况下,该报表中的列设置为特定大小。 因此,如果列名或值很长,则在 Excel 中有可能不可见或显示为 ###。 您可以调整行的大小使值可见。 如果选择了单元格,则可以单击并拖动编辑栏右端的双箭头,以显示完整的值或字符串。
摘要报表
元数据 | 模型名称 模型说明 算法名称 上次处理日期 |
|
模型结果 | 关联 | 项集计数 规则计数 |
群集 | 分类计数 对每个分类的支持 |
|
决策树 | 树数 每个树中的节点数 |
|
线性回归 | 树数(始终为 1) 节点数(始终为 1) |
|
Naïve Bayes | 重要属性 | |
神经网络 | 输入节点数 输出节点数 隐藏节点数 |
|
顺序分析和聚类分析 | 分类数 |
完整报表
完整报表包含摘要报表中的所有内容,以及有关模型中使用的数据列和分析结果的详细信息:
元数据 | 模型元数据 | 算法参数和值 |
列元数据 | 列名称 使用情况 数据类型 内容类型 值(离散值的列表或值的范围) |
|
模型统计信息 | 连续列 | 平均值 最小值 最大值 均方根误差 平均绝对误差 对数评分 回归公式(仅用于线性回归模型) |
离散列 | 传递计数 失败计数 对数评分 提升 |
注意
您可以记录 SQL Server Analysis Services 支持的任何模型类型。 因此,该表列出了使用表分析工具或数据挖掘客户端中的向导无法创建的某些模型类型。 但是,可以使用高级数据挖掘查询编辑器创建所有模型类型。 有关详细信息,请参阅查询 (SQL Server数据挖掘加载项) 。