Componente: Assegnare dati ai cluster

Questo articolo descrive come usare il componente Assegna dati ai cluster nella finestra di progettazione di Azure Machine Learning. Il componente genera stime tramite un modello di clustering sottoposto a training con l'algoritmo di clustering K-means.

Il componente Assign Data to Clusters restituisce un set di dati contenente le assegnazioni probabili per ogni nuovo punto dati.

Come usare Assign Data to Clusters

  1. Nella finestra di progettazione di Azure Machine Learning individuare un modello di clustering con training precedente. È possibile creare ed eseguire il training di un modello di clustering usando uno dei metodi seguenti:

    • Configurare l'algoritmo di clustering K-means usando il componente clustering K-Means ed eseguire il training del modello usando un set di dati e il componente Train Clustering Model (questo articolo).

    • È anche possibile aggiungere un modello di clustering con training esistente dal gruppo Modelli salvati nell'area di lavoro.

  2. Collegare il modello sottoposto a training alla porta di input sinistra di Assign Data to Clusters (Assegna dati ai cluster).

  3. Collegare un nuovo set di dati come input.

    In questo set di dati le etichette sono facoltative. In genere, il clustering è un metodo di apprendimento non supervisionato. Non si prevede di conoscere le categorie in anticipo. Tuttavia, le colonne di input devono essere uguali alle colonne usate per il training del modello di clustering o si verifica un errore.

    Suggerimento

    Per ridurre il numero di colonne scritte nella finestra di progettazione dalle stime del cluster, usare Select columns in the dataset (Seleziona colonne nel set di dati) e selezionare un subset delle colonne.

  4. Lasciare selezionata la casella di controllo Controlla accodamento o deseleziona per il risultato solo se si desidera che i risultati contengano il set di dati di input completo, inclusa una colonna che visualizza i risultati (assegnazioni cluster).

    Se si deseleziona questa casella di controllo, vengono restituiti solo i risultati. Questa opzione può essere utile quando si creano stime come parte di un servizio Web.

  5. Inviare la pipeline.

Risultati

  • Per visualizzare i valori nel set di dati, fare clic con il pulsante destro del mouse sul componente e quindi scegliere Visualizza. In alternativa, selezionare il componente e passare alla scheda Output nel pannello destro, fare clic sull'icona dell'istogramma negli output porta per visualizzare il risultato.