Компонент: назначение данных кластерам
В этой статье описывается, как использовать компонент Назначение данных кластерам в конструкторе машинного обучения Azure. Компонент генерирует прогнозы с помощью модели кластеризации, обученной с помощью алгоритма кластеризации методом k-средних.
Компонент "Назначить данные кластерам" возвращает набор данных, содержащий вероятные назначения для каждой новой точки данных.
Как использовать присвоение данных кластерам
В конструкторе машинного обучения Azure найдите ранее обученную модель кластеризации. Вы можете создать и обучить модель кластеризации, используя любой из следующих методов.
Настройте алгоритм кластеризации методом k-средних с помощью компонента кластеризации методом k-средних и обучите модель с помощью набора данных и компонента "Обучение модели кластеризации" (эта статья).
Вы также можете добавить существующую обученную модель кластеризации из группы Сохраненные модели в своей рабочей области.
Присоедините обученную модель к левому порту ввода для Назначения данных кластерам.
Прикрепите новый набор данных в качестве входных данных.
В этом наборе данных метки необязательны. Как правило, кластеризация — это метод обучения без учителя. От вас не ожидается, что вы будете знать категории заранее. Однако входные столбцы должны быть такими же, как столбцы, которые использовались при обучении модели кластеризации, в противном случае произойдет ошибка.
Совет
Чтобы уменьшить количество столбцов, которые записываются в конструктор из прогнозов кластера, используйте Выбрать столбцы в наборе данных и выберите подмножество столбцов.
Оставьте флажок Проверить добавление или снять флажок только для результата, если вы хотите, чтобы результаты содержали полный набор входных данных, включая столбец, в котором отображаются результаты (назначения кластеров).
Если снять этот флажок, будут возвращены только результаты. Эта опция может быть полезна, когда вы создаете прогнозы как часть веб-службы.
Отправьте конвейер.
Результаты
- Чтобы просмотреть значения в наборе данных, щелкните компонент правой кнопкой мыши и выберите Визуализировать. Также можно выбрать этот компонент и перейти на вкладку Выходные данные на панели справа, щелкнуть значок гистограммы в области Port outputs (Портировать выходные данные), чтобы визуализировать результат.