Изучение модели «Потребительская корзина» (Учебник по интеллектуальному анализу данных)

Изменения: 15 сентября 2007 г.

После создания модели Взаимосвязь можно изучить ее, используя средство просмотра взаимосвязей Microsoft на вкладке Средство просмотра моделей интеллектуального анализа данных конструктора интеллектуального анализа данных. При изучении модели можно легко увидеть, какие продукты появляются вместе, и исследовать связи между элементами. Можно также отфильтровать более слабые взаимосвязи и получить общее представление о формирующихся закономерностях.

В средстве просмотра взаимосвязей Microsoft доступны три вкладки: Наборы элементов, Правила и Сеть зависимостей. Дополнительные сведения об этом средстве просмотра см. в разделе Просмотр модели интеллектуального анализа данных при помощи средства просмотра правил взаимосвязи (Microsoft).

Вкладка «Наборы элементов»

На вкладке Наборы элементов отображаются три важных аспекта сведений, имеющих отношение к наборам элементов, которые выявляются с алгоритмом взаимосвязей (Microsoft): поддержка (число транзакций, в которых участвует данный набор элементов); размер (число элементов в наборе); а также фактический состав набора элементов. В зависимости от того, каким образом настроены параметры алгоритма, он может создать большое число наборов элементов. Используя элементы управления в верхней части вкладки Наборы элементов, можно показывать в средстве отображения только наборы, содержащие определенную минимальную поддержку и размер набора элементов.

Также можно использовать поле Фильтровать набор элементов, чтобы отфильтровать наборы, отображаемые в средстве просмотра. Например, чтобы увидеть только те наборы, которые содержат сведения о велосипеде «Mountain-200», введите в поле Фильтровать набор элементов значение Mountain-200. В средстве просмотра будут отображены только наборы элементов, содержащие слова «Mountain-200». Каждый набор, получаемый средством просмотра, содержит сведения о транзакциях, в которых был продан велосипед «Mountain-200». Например, набор элементов, содержащий значение 710 в столбце Поддержка, указывает, что из всех транзакций 710 человек, которые купили велосипед «Mountain-200», приобрели также велосипед «Sport-100».

Вкладка «Правила»

На вкладке Правила отображаются следующие связанные с правилами сведения, которые выявляет алгоритм.

  • Вероятность
    Вероятность того, что правило будет применено.
  • Важность
    Мера полезности правила. Большее значение означает более полезное правило. Выводы, сделанные только на основе значения вероятности, могут оказаться неверными. Например, если каждая транзакция содержит элемент x, правило y выдаст прогноз, что вероятность х равна 1, который означает, что элемент x будет присутствовать всегда. Хотя точность этого правила очень велика, оно не очень показательно, поскольку каждая транзакция содержит x вне зависимости от y.
  • Правило
    Определение правила.

Как и на вкладке Наборы элементов, здесь можно фильтровать правила таким образом, чтобы отображались только нужные. Например, если требуется видеть только правила, связанные с велосипедом «Mountain-200», введите в поле Правило фильтра значение Mountain-200. Теперь в средстве просмотра будут отображаться лишь правила, которые содержат слова «Mountain-200». Каждое из правил можно использовать для прогноза наличия позиции в транзакции на основе наличия других позиций. Например, в соответствии с первым правилом, если кто-нибудь покупает велосипед Mountain-200 и флягу для воды, он с вероятностью 1 также купит держатель бутылки Mountain.

Вкладка «Сеть зависимостей»

С помощью вкладки Сеть зависимостей можно исследовать взаимодействие различных элементов модели. В средстве просмотра каждый узел отображает элемент, например «Mountain-200 = Существующий узел» означает, что в транзакции присутствует «Mountain-200». Выбирая узел, можно использовать цветовые условные обозначения в нижней части вкладки, чтобы определить, какие элементы определяют другие элементы модели или определены ими.

Ползунок связан со значением вероятности правила. Передвигая ползунок вверх или вниз, можно отфильтровать слабые взаимосвязи. Например, в поле Отобразить выберите Отобразить только имя атрибута и щелкните узел Mountain Bottle Cage. В средстве просмотра будет показано, что данный элемент предсказывает и предсказан флягой для воды и велосипедом Mountain-200. Это означает, что данные элементы с большой долей вероятности будут присутствовать в одной транзакции. Другими словами, если клиент покупает велосипед, он, скорее всего, купит флягу для воды и держатель для нее.

Следующее занятие

Занятие 5. Построение сценария кластеризации последовательностей