Компонент: назначение данных кластерам

В этой статье описывается, как использовать компонент Назначение данных кластерам в конструкторе машинного обучения Azure. Компонент генерирует прогнозы с помощью модели кластеризации, обученной с помощью алгоритма кластеризации методом k-средних.

Компонент "Назначить данные кластерам" возвращает набор данных, содержащий вероятные назначения для каждой новой точки данных.

Как использовать присвоение данных кластерам

  1. В конструкторе машинного обучения Azure найдите ранее обученную модель кластеризации. Вы можете создать и обучить модель кластеризации, используя любой из следующих методов.

    • Настройте алгоритм кластеризации методом k-средних с помощью компонента кластеризации методом k-средних и обучите модель с помощью набора данных и компонента "Обучение модели кластеризации" (эта статья).

    • Вы также можете добавить существующую обученную модель кластеризации из группы Сохраненные модели в своей рабочей области.

  2. Присоедините обученную модель к левому порту ввода для Назначения данных кластерам.

  3. Прикрепите новый набор данных в качестве входных данных.

    В этом наборе данных метки необязательны. Как правило, кластеризация — это метод обучения без учителя. От вас не ожидается, что вы будете знать категории заранее. Однако входные столбцы должны быть такими же, как столбцы, которые использовались при обучении модели кластеризации, в противном случае произойдет ошибка.

    Совет

    Чтобы уменьшить количество столбцов, которые записываются в конструктор из прогнозов кластера, используйте Выбрать столбцы в наборе данных и выберите подмножество столбцов.

  4. Оставьте флажок Проверить добавление или снять флажок только для результата, если вы хотите, чтобы результаты содержали полный набор входных данных, включая столбец, в котором отображаются результаты (назначения кластеров).

    Если снять этот флажок, будут возвращены только результаты. Эта опция может быть полезна, когда вы создаете прогнозы как часть веб-службы.

  5. Отправьте конвейер.

Результаты

  • Чтобы просмотреть значения в наборе данных, щелкните компонент правой кнопкой мыши и выберите Визуализировать. Также можно выбрать этот компонент и перейти на вкладку Выходные данные на панели справа, щелкнуть значок гистограммы в области Port outputs (Портировать выходные данные), чтобы визуализировать результат.