浏览 Naive Bayes 模型(数据挖掘基础教程)

Microsoft Naive Bayes 算法提供了多种方法来显示自行车购买与输入属性之间的交互。

Microsoft Naive Bayes 查看器提供以下选项卡,用于浏览 Naive Bayes 挖掘模型:

依赖关系网络

依赖项网络 ”选项卡的工作方式与 Microsoft 树查看器的“ 依赖项网络 ”选项卡相同。 查看器中的每个节点代表一个属性,而节点之间的线条代表关系。 在查看器中,您可以查看影响可预测属性 Bike Buyer 的状态的所有属性。

在“依赖关系网络”选项卡中浏览模型

  1. 使用“ 挖掘模型 查看器”选项卡顶部的 “挖掘模型 ”列表切换到模型 TM_NaiveBayes

  2. 使用 查看器 列表切换到 Microsoft Naive Bayes Viewer

  3. 单击节点 Bike Buyer 以标识其依赖项。

    粉色阴影指示所有属性都会对自行车购买行为产生影响。

  4. 调整滑块可标识影响最大的属性。

    向下滑动滑块时,将只保留对 [Bike Buyer] 列影响最大的属性。 通过调整滑块,可以发现影响最大的几个属性为:拥有汽车的数量、通勤距离以及子女总数。

属性配置文件

属性配置文件 ”选项卡描述输入属性的不同状态如何影响可预测属性的结果。

在“属性配置文件”选项卡中浏览模型

  1. 在“ 可预测 ”框中,验证 Bike Buyer 是否已选中。

  2. 如果 挖掘图例 阻止显示 属性配置文件,请将其移开。

  3. “直方图 条形图”框中,选择“ 5”。

    在我们的模型中,任意一个变量的最大状态数均为 5。

    系统会列出影响该可预测属性的状态的属性以及输入属性的每个状态的值及其在该可预测属性的每个状态中的分布。

  4. “属性” 列中,找到 “拥有的汽车编号”。 请注意,自行车购买者(标为 1 的列)与非自行车购买者(标为 0 的列)的直方图的差异。 如果一个人拥有的汽车数量为 0 或 1,则此人很有可能会购买自行车。

  5. 双击自行车购买者 (列中标记为 1) 列的“ 拥有的汽车数量 ”单元格。

    挖掘图例显示更详细的视图。

属性特征

使用“ 属性特征 ”选项卡,可以选择属性和值,以查看其他属性的值在所选值事例中的显示频率。

在“属性特征”选项卡中浏览模型

  1. “属性” 列表中,验证 Bike Buyer 是否已选中。

  2. “值 ”设置为 1

    在查看器中,您将看到,家中无子女、通勤距离较近和居住在北美洲地区的客户更有可能购买自行车。

属性对比

使用“ 属性歧视 ”选项卡,可以调查自行车购买的两个离散值与其他属性值之间的关系。 TM_NaiveBayes由于模型只有两种状态(1 和 0),因此无需对查看器进行任何更改。

在查看器中,您会看到,没有汽车的人一般会购买自行车,而有两辆汽车的人一般不会购买自行车。

请参阅以下主题以了解其他挖掘模型。

下一课

第 5 课:测试模型(数据挖掘基础教程)

课程中的前一个任务

浏览聚类分析模型(数据挖掘基础教程)

另请参阅

使用 Microsoft Naive Bayes 查看器浏览模型
“属性对比”选项卡(挖掘模型查看器)
“属性配置文件”选项卡(挖掘模型查看器)
“属性特征”选项卡(挖掘模型查看器)
“依赖关系网络”选项卡(挖掘模型查看器)