Компонент: назначение данных кластерам

Статья
09/01/2024

В этой статье описывается, как использовать компонент Назначение данных кластерам в конструкторе машинного обучения Azure. Компонент генерирует прогнозы с помощью модели кластеризации, обученной с помощью алгоритма кластеризации методом k-средних.

Компонент "Назначить данные кластерам" возвращает набор данных, содержащий вероятные назначения для каждой новой точки данных.

Как использовать присвоение данных кластерам

В конструкторе машинного обучения Azure найдите ранее обученную модель кластеризации. Вы можете создать и обучить модель кластеризации, используя любой из следующих методов.
- Настройте алгоритм кластеризации методом k-средних с помощью компонента кластеризации методом k-средних и обучите модель с помощью набора данных и компонента "Обучение модели кластеризации" (эта статья).
- Вы также можете добавить существующую обученную модель кластеризации из группы Сохраненные модели в своей рабочей области.
Присоедините обученную модель к левому порту ввода для Назначения данных кластерам.
Прикрепите новый набор данных в качестве входных данных.

В этом наборе данных метки необязательны. Как правило, кластеризация — это метод обучения без учителя. От вас не ожидается, что вы будете знать категории заранее. Однако входные столбцы должны быть такими же, как столбцы, которые использовались при обучении модели кластеризации, в противном случае произойдет ошибка.

Совет

Чтобы уменьшить количество столбцов, которые записываются в конструктор из прогнозов кластера, используйте Выбрать столбцы в наборе данных и выберите подмножество столбцов.
Оставьте флажок Проверить добавление или снять флажок только для результата, если вы хотите, чтобы результаты содержали полный набор входных данных, включая столбец, в котором отображаются результаты (назначения кластеров).

Если снять этот флажок, будут возвращены только результаты. Эта опция может быть полезна, когда вы создаете прогнозы как часть веб-службы.
Отправьте конвейер.

Результаты

Чтобы просмотреть значения в наборе данных, щелкните компонент правой кнопкой мыши и выберите Визуализировать. Также можно выбрать этот компонент и перейти на вкладку Выходные данные на панели справа, щелкнуть значок гистограммы в области Port outputs (Портировать выходные данные), чтобы визуализировать результат.

Поделиться через

Компонент: назначение данных кластерам

Как использовать присвоение данных кластерам

Результаты

Обратная связь

Дополнительные ресурсы