从示例填充(Excel 表分析工具)
“ 从示例填充” 工具可帮助你根据现有值生成新的数据列。
例如,假设数据包含一个 “购买金额” 列、一个 “订单数量 ”列和一个“ 顶级客户” 列,该列基于使用其他列的某个公式。 如果 “顶级客户” 列包含许多空白行,则可以使用“ 购买金额” 和“ 订单数量” 列作为输入来推断缺失值。 该工具分析数据中的现有模式和所输入的示例,预测分配给每个客户的类别。
如果您对结果不满意,可以通过提供更多的示例来改进结果。
使用从示例填充工具
在 “分析” 功能区中,单击“ 从示例中填充”。
该工具将基于对数据的分析,自动挑选一列进行填充,您可接受也可覆盖建议的值。
为新数据创建一列,并键入要预测的数据的示例。 请确保要预测的每个值都至少有一个示例。 如果要在现有列中填充数据,请选择那个包含缺失值的列。
(可选)单击“ 选择要在分析中使用的列”。 在“ 高级列选择 ”对话框中,指定填充缺失数据时最有用的列。
例如,如果根据经验,您知道一列和包含缺失值的列之间存在因果关系,您可以取消选择其他列,以获得更佳结果。
单击“确定”。
单击 “运行” 。
分析完成后,该工具将创建一个新的 模式 工作表,其中包含分析结果。 报表列出找到的规则或关键影响因素,并显示每个规则的概率。
此工具还自动向原始数据表添加包含新值的列。 您可查看这些值,并将它们与原始值进行比较。
要求
您只能处理列中的数据。 如果要填充的序列存储在行中,可使用 Excel 中的粘贴、转置功能,将这些数据更改为列格式。
理解模式报表
运行“ 从示例填充” 工具时,会创建一个报表,提供有关检测到的模式的详细信息。 这些模式用于推断新数据值。
该模式报表显示每个预测值的关键影响因素。 每个影响因素或规则都被描述为列、列中的值以及规则对预测的相对影响的组合。
例如,如果您尝试填写一张显示订单发货距离的工作表,您可能会很自然地想到目的地对发货距离有重要影响。 在这种情况下,报表可能包含以下行:
列 | 值 | 倾向于 | 相对影响 |
---|---|---|---|
StateProvinceCode | AB | >500 公里 | 80% |
这意味着 StateProvinceCode 列中的值 AB 强预测 500 公里的 >运输距离。
通常预测所基于的模式远比此示例复杂,对于每个预测,该报表可能会包含许多行规则。 预测值是所有规则综合作用的结果。
注意
相对影响 显示为阴影条。 该条越长,此规则对所填充的值的预测概率就越大。
该工具还会向原始数据表添加新列,名为 <“扩展”> 列。
如果原始数据列中包含值,则该值将被复制到新列中。 但是,如果原始列包含空白单元,则在新列的相应位置将包含该向导预测的值。
相关工具和信息
还可以使用 Excel 数据挖掘客户端中提供的 “浏览数据 ”向导来检查 Excel 列中值的分布。 有关详细信息,请参阅 浏览和清理数据。