Moduli di clustering

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo descrive i moduli di Machine Learning Studio (versione classica) che supportano la creazione di modelli di clustering.

Nota

Si applica a: Machine Learning Studio (versione classica)

Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.

Che cos'è il clustering?

Il clustering, in Machine Learning, è un metodo per raggruppare i punti dati in cluster simili. Viene anche chiamata segmentazione.

Nel corso degli anni sono stati sviluppati molti algoritmi di clustering. Quasi tutti gli algoritmi di clustering usano le funzionalità dei singoli elementi per trovare elementi simili. Ad esempio, è possibile applicare il clustering per trovare persone simili in base ai dati demografici. È possibile usare il clustering con l'analisi del testo per raggruppare frasi con argomenti o sentiment simili.

Il clustering è detto tecnica di apprendimento senza supervisione perché può essere usata in dati senza etichetta. In effetti, il clustering è un primo passaggio utile per l'individuazione di nuovi modelli e richiede conoscenze precedenti su come i dati potrebbero essere strutturati o come sono correlati gli elementi. Il clustering viene spesso usato per l'esplorazione dei dati prima dell'analisi con altri algoritmi più predittivi.

Come creare un modello di clustering

In Machine Learning Studio (versione classica) è possibile usare il clustering con dati etichettati o senza etichetta.

  • Nei dati senza etichetta, l'algoritmo di clustering determina quali punti dati sono più vicini tra loro e crea cluster intorno a un punto centrale, o centroide. È quindi possibile usare l'ID cluster come etichetta temporanea per il gruppo di dati.

  • Se i dati hanno etichette, è possibile usare l'etichetta per determinare il numero di cluster o usare l'etichetta come un'altra funzionalità.

Dopo aver configurato l'algoritmo di clustering, è possibile eseguire il training sui dati usando i moduli Train Clustering Model (Training modello di clustering) o Sweep Clustering ( Sweep Clustering ).

Quando si esegue il training del modello, usarlo per stimare l'appartenenza al cluster per i nuovi punti dati. Ad esempio, se è stato usato il clustering per raggruppare i clienti in base al comportamento di acquisto, è possibile usare il modello per stimare il comportamento di acquisto dei nuovi clienti.

Elenco dei moduli

La categoria di clustering include questo modulo:

Per usare un algoritmo di clustering diverso o creare un modello di clustering personalizzato con R, vedere questi argomenti:

Esempio

Per esempi di clustering in azione, vedere il Azure AI Gallery.

Per informazioni sulla scelta di un algoritmo, vedere gli articoli seguenti:

Vedi anche