Eseguire il training del modello di clustering
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Esegue il training di un modello di clustering e assegna dati del set di training ai cluster
Categoria: Machine Learning/Train
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Train Clustering Model (Training Clustering Model) in Machine Learning Studio (versione classica) per eseguire il training di un modello di clustering.
Il modulo accetta un modello di clustering senza training che è già stato configurato usando il modulo K-Means Clustering ed eservirà il training del modello usando un set di dati con etichetta o senza etichetta. Il modulo crea sia un modello con training che è possibile usare per la stima e un set di assegnazioni di cluster per ogni caso nei dati di training.
Nota
Non è possibile eseguire il training di un modello di clustering usando il modulo Train Model ( Train Model ), che è il modulo generico per la creazione di modelli di Machine Learning. Questo perché Train Model funziona solo con algoritmi di apprendimento con supervisione. K-means e altri algoritmi di clustering consentono l'apprendimento senza supervisione, vale a dire che l'algoritmo può apprendere dai dati senza etichetta.
Come usare il training del modello di clustering
Aggiungere il modulo Train Clustering Model (Training Clustering Model ) all'esperimento in Studio (versione classica). È possibile trovare il modulo in Machine Learning moduli, nella categoria Train (Training).
Aggiungere il modulo K-Means Clustering o un altro modulo personalizzato che crea un modello di clustering compatibile e impostare i parametri del modello di clustering.
Collegare un set di dati di training all'input a destra del modello di training clustering.
In Set di colonne selezionare le colonne del set di dati da usare per la creazione di cluster. Assicurarsi di selezionare le colonne che costituiscono caratteristiche utili: ad esempio, evitare di usare ID o altre colonne con valori univoci o colonne con tutti gli stessi valori.
Se è disponibile un'etichetta, è possibile usarla come funzionalità o non usarla.
Selezionare l'opzione Controlla accodamento o Deseleziona solo per Solo risultato, se si desidera visualizzare i dati di training insieme alla nuova etichetta del cluster.
Se si deseleziona questa opzione, vengono restituite solo le assegnazioni del cluster.
Eseguire l'esperimento oppure fare clic sul modulo Train Clustering Model (Esegui modello di clustering ) e selezionare Run Selected (Esegui selezionato).
Risultati
Al termine del training:
Per visualizzare il cluster e la relativa separazione in un grafico, fare clic con il pulsante destro del mouse sull'output del set di dati Risultati e scegliere Visualizza.
Il grafico rappresenta i componenti principali del cluster, anziché i valori effettivi. Per altre informazioni, vedere Principal Component Analysis (Analisi dei componenti dell'entità).
Per visualizzare i valori nel set di dati, aggiungere un'istanza del modulo Converti in set di dati e connetterla all'output del set di dati Risultati . Eseguire il modulo Converti in set di dati per ottenere una copia dei dati che è possibile visualizzare o scaricare.
Per salvare il modello con training per un successivo utilizzo, fare clic con il pulsante destro del mouse sul modulo, scegliere Modello con training e fare clic su Salva come modello con training.
Per generare punteggi dal modello, usare Assegna dati ai cluster.
Esempio
Per un esempio dell'uso del clustering in Machine Learning, vedere l'Azure AI Gallery:
Clustering: trova società simili: illustra come usare il clustering su attributi derivati da testo non strutturato.
Clustering: quantizzazione dei colori: illustra come usare il clustering per trovare i colori correlati e ridurre il numero di bit usati nelle immagini.
Clustering: raggruppa i dati iris: fornisce un semplice esempio di clustering basato sul set di dati iris.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Untrained model | ICluster interface | Modello di clustering senza training |
Set di dati | Tabella dati | Origine dati di input |
Parametri del modulo
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Column Set | any | ColumnSelection | Criterio di selezione delle colonne | |
Check for Append or Uncheck for Result Only | any | Boolean | true | Specifica se il set di dati di output deve contenere il set di dati di input aggiunto dalla colonna delle assegnazioni (selezionato) o solo la colonna delle assegnazioni (non selezionato) |
Output
Nome | Tipo | Descrizione |
---|---|---|
Trained model | ICluster interface | Modello di clustering con training |
Set di dati di risultati | Tabella dati | Set di dati di input aggiunto dalla colonna di dati delle assegnazioni oppure solo la colonna delle assegnazioni |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0003 | L'eccezione si verifica se uno o più input sono null o vuoti. |
Per un elenco degli errori specifici dei moduli di Studio (versione classica), vedere Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere Machine Learning di errore dell'API REST.
Vedi anche
Elenco moduli A-Z
Esecuzione del training
Assign Data to Clusters (Assegna dati ai cluster)
Clustering K-Means