Изучение модели упрощенного алгоритма Байеса (учебник по интеллектуальному анализу данных — начальный уровень)

Упрощенный алгоритм Байеса (Майкрософт) предоставляет несколько способов отображения взаимосвязи между покупкой велосипедов и входными атрибутами.

Средство просмотра упрощенного алгоритма Байеса (Майкрософт) содержит следующие вкладки для обзора моделей интеллектуального анализа данных упрощенных алгоритмов Байеса:

Dependency Network

Attribute Profiles

Attribute Characteristics

Attribute Discrimination

Следующие разделы посвящены исследованию других моделей интеллектуального анализа данных.

Сеть зависимостей

Вкладка Сеть зависимостей работает точно так же, как и вкладка Сеть зависимостей средства просмотра деревьев (Майкрософт). Каждый из узлов в средстве просмотра отображает атрибут, а линии между узлами представляют связи. В средстве просмотра показаны все атрибуты, влияющие на состояние прогнозируемого атрибута «Покупатель велосипеда».

Исследование модели на вкладке «Сеть зависимостей»

  1. Выберите модель TM_NaiveBayes в списке Модель интеллектуального анализа данных в верхней части вкладки Средство просмотра моделей интеллектуального анализа данных.

  2. Используйте список Средство просмотра, чтобы переключиться в Средство просмотра упрощенного алгоритма Байеса (Майкрософт).

  3. Щелкните узел Покупатель велосипеда для определения его зависимостей.

    Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.

  4. Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.

    По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Покупатель велосипеда]. Перемещая ползунок, можно узнать, что несколькими атрибутами, оказывающими наибольшее влияние, являются число имеющихся в распоряжении автомобилей, расстояние до работы и общее количество детей.

В начало

Профили атрибутов

На вкладке Профили атрибутов показано, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.

Исследование модели на вкладке «Профили атрибутов»

  1. Убедитесь, что в поле Прогнозируемый выбрано Покупатель велосипеда.

  2. Если Обозначения интеллектуального анализа данных закрывает собой Профили атрибутов, переместите его в другое место.

  3. В поле Столбцы гистограммы выберите значение 5.

    В рассматриваемой модели значение 5 — это максимальное количество состояний для любой переменной.

    Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.

  4. В столбце Атрибуты найдите пункт Число машин во владении. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.

  5. Дважды щелкните ячейку Число машин во владении в столбце покупателя велосипеда (столбец с меткой 1).

    Обозначения интеллектуального анализа данных отображает более подробное представление.

В начало

Характеристики атрибута

На вкладке Характеристики атрибута можно выбрать атрибут и значение, чтобы узнать частоту появления значений других атрибутов во вхождениях выбранного значения.

Исследование модели на вкладке «Характеристики атрибута»

  1. Убедитесь, что в списке Атрибут выбрано Покупатель велосипеда.

  2. В поле Значение выберите 1.

    В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.

В начало

Сравнение атрибутов

На вкладке Сравнение атрибутов можно изучать связь между двумя дискретными значениями покупателей велосипеда и другими значениями атрибутов. Поскольку в модели TM_NaiveBayes предусмотрено только два состояния, 1 и 0, не требуется вносить изменения в средство просмотра.

В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.

См. также

Справочник

Основные понятия