从示例填充(Excel 表分析工具)

表分析工具中的“从示例填充”按钮表分析工具

从示例填充” 工具可帮助你根据现有值生成新的数据列。

例如,假设数据包含一个 “购买金额” 列、一个 “订单数量 ”列和一个“ 顶级客户” 列,该列基于使用其他列的某个公式。 如果 “顶级客户” 列包含许多空白行,则可以使用“ 购买金额” 和“ 订单数量” 列作为输入来推断缺失值。 该工具分析数据中的现有模式和所输入的示例,预测分配给每个客户的类别。

如果您对结果不满意,可以通过提供更多的示例来改进结果。

使用从示例填充工具

  1. “分析” 功能区中,单击“ 从示例中填充”。

  2. 该工具将基于对数据的分析,自动挑选一列进行填充,您可接受也可覆盖建议的值。

  3. 为新数据创建一列,并键入要预测的数据的示例。 请确保要预测的每个值都至少有一个示例。 如果要在现有列中填充数据,请选择那个包含缺失值的列。

  4. (可选)单击“ 选择要在分析中使用的列”。 在“ 高级列选择 ”对话框中,指定填充缺失数据时最有用的列。

    例如,如果根据经验,您知道一列和包含缺失值的列之间存在因果关系,您可以取消选择其他列,以获得更佳结果。

    单击“确定”。

  5. 单击 “运行”

    分析完成后,该工具将创建一个新的 模式 工作表,其中包含分析结果。 报表列出找到的规则或关键影响因素,并显示每个规则的概率。

    此工具还自动向原始数据表添加包含新值的列。 您可查看这些值,并将它们与原始值进行比较。

要求

您只能处理列中的数据。 如果要填充的序列存储在行中,可使用 Excel 中的粘贴、转置功能,将这些数据更改为列格式。

理解模式报表

运行“ 从示例填充” 工具时,会创建一个报表,提供有关检测到的模式的详细信息。 这些模式用于推断新数据值。

该模式报表显示每个预测值的关键影响因素。 每个影响因素或规则都被描述为列、列中的值以及规则对预测的相对影响的组合。

例如,如果您尝试填写一张显示订单发货距离的工作表,您可能会很自然地想到目的地对发货距离有重要影响。 在这种情况下,报表可能包含以下行:

倾向于 相对影响
StateProvinceCode AB >500 公里 80%

这意味着 StateProvinceCode 列中的值 AB 强预测 500 公里的 >运输距离。

通常预测所基于的模式远比此示例复杂,对于每个预测,该报表可能会包含许多行规则。 预测值是所有规则综合作用的结果。

注意

相对影响 显示为阴影条。 该条越长,此规则对所填充的值的预测概率就越大。

该工具还会向原始数据表添加新列,名为 <“扩展”> 列。

如果原始数据列中包含值,则该值将被复制到新列中。 但是,如果原始列包含空白单元,则在新列的相应位置将包含该向导预测的值。

还可以使用 Excel 数据挖掘客户端中提供的 “浏览数据 ”向导来检查 Excel 列中值的分布。 有关详细信息,请参阅 浏览和清理数据

另请参阅

Excel 表分析工具