Изучение модели упрощенного алгоритма Байеса (учебник по интеллектуальному анализу данных — начальный уровень)
Упрощенный алгоритм Байеса (Майкрософт) предоставляет несколько способов отображения взаимосвязи между покупкой велосипедов и входными атрибутами.
Средство просмотра упрощенного алгоритма Байеса (Майкрософт) содержит следующие вкладки для обзора моделей интеллектуального анализа данных упрощенных алгоритмов Байеса:
Dependency Network
Attribute Profiles
Attribute Characteristics
Attribute Discrimination
Следующие разделы посвящены исследованию других моделей интеллектуального анализа данных.
Сеть зависимостей
Вкладка Сеть зависимостей работает точно так же, как и вкладка Сеть зависимостей средства просмотра деревьев (Майкрософт). Каждый из узлов в средстве просмотра отображает атрибут, а линии между узлами представляют связи. В средстве просмотра показаны все атрибуты, влияющие на состояние прогнозируемого атрибута «Покупатель велосипеда».
Исследование модели на вкладке «Сеть зависимостей»
Выберите модель TM_NaiveBayes в списке Модель интеллектуального анализа данных в верхней части вкладки Средство просмотра моделей интеллектуального анализа данных.
Используйте список Средство просмотра, чтобы переключиться в Средство просмотра упрощенного алгоритма Байеса (Майкрософт).
Щелкните узел Покупатель велосипеда для определения его зависимостей.
Розовая заливка указывает на то, что все атрибуты влияют на покупку велосипедов.
Определите с помощью ползунка атрибут, оказывающий наибольшее влияние.
По мере перемещения ползунка вниз остаются только атрибуты, оказывающие наибольшее влияние на столбец [Покупатель велосипеда]. Перемещая ползунок, можно узнать, что несколькими атрибутами, оказывающими наибольшее влияние, являются число имеющихся в распоряжении автомобилей, расстояние до работы и общее количество детей.
В начало
Профили атрибутов
На вкладке Профили атрибутов показано, как различные состояния входных атрибутов влияют на результат прогнозируемого атрибута.
Исследование модели на вкладке «Профили атрибутов»
Убедитесь, что в поле Прогнозируемый выбрано Покупатель велосипеда.
Если Обозначения интеллектуального анализа данных закрывает собой Профили атрибутов, переместите его в другое место.
В поле Столбцы гистограммы выберите значение 5.
В рассматриваемой модели значение 5 — это максимальное количество состояний для любой переменной.
Атрибуты, влияющие на состояние данного прогнозируемого атрибута, перечисляются вместе со значениями каждого состояния входных атрибутов и их распределениями по каждому состоянию прогнозируемого атрибута.
В столбце Атрибуты найдите пункт Число машин во владении. Обратите внимание на различия в гистограммах для покупателей велосипедов (столбец с меткой 1) и тех, кто не покупает (столбец с меткой 0). Человек, у которого есть один автомобиль или вообще нет машины, является наиболее вероятным покупателем велосипеда.
Дважды щелкните ячейку Число машин во владении в столбце покупателя велосипеда (столбец с меткой 1).
Обозначения интеллектуального анализа данных отображает более подробное представление.
В начало
Характеристики атрибута
На вкладке Характеристики атрибута можно выбрать атрибут и значение, чтобы узнать частоту появления значений других атрибутов во вхождениях выбранного значения.
Исследование модели на вкладке «Характеристики атрибута»
Убедитесь, что в списке Атрибут выбрано Покупатель велосипеда.
В поле Значение выберите 1.
В средстве просмотра будут показано, что заказчики, которые не имеют проживающих с ними детей, работают недалеко от дома и живут в Североамериканском регионе, являются более вероятными покупателями велосипеда.
В начало
Сравнение атрибутов
На вкладке Сравнение атрибутов можно изучать связь между двумя дискретными значениями покупателей велосипеда и другими значениями атрибутов. Поскольку в модели TM_NaiveBayes предусмотрено только два состояния, 1 и 0, не требуется вносить изменения в средство просмотра.
В средстве просмотра показано, что велосипеды, как правило, покупают люди, не имеющие в распоряжении машин, и наоборот, люди, имеющие две машины, большей частью велосипеды не покупают.
Следующее занятие
Занятие 5. Проверка моделей (учебник по интеллектуальному анализу данных — начальный уровень)
Предыдущая задача занятия
Изучение модели кластеризации (учебник по интеллектуальному анализу данных — начальный уровень)
См. также