Informazioni di riferimento sugli algoritmi e sui componenti per la finestra di progettazione di Azure Machine Learning
SI APPLICA A: Python SDK azure-ai-ml v2 (corrente)
Nota
La finestra di progettazione supporta due tipi di componenti, ovvero i componenti predefiniti classici e i componenti personalizzati. Questi due tipi di componenti non sono compatibili.
Componenti predefiniti classici: sono componenti predefiniti principalmente pensati per l'elaborazione dei dati e le attività tradizionali di apprendimento automatico, ad esempio regressione e classificazione. Questo tipo di componente continua a essere supportato, ma non avrà nuove aggiunte future.
I componenti personalizzati consentono di fornire codice personalizzato come componente. Supporta la condivisione tra aree di lavoro e la creazione semplice tra interfacce di Studio, interfaccia della riga di comando e SDK.
Questo articolo si applica ai componenti classici predefiniti.
Questo contenuto di riferimento fornisce informazioni tecniche su ognuno dei componenti predefiniti classici disponibili nella finestra di progettazione di Azure Machine Learning.
Ogni componente rappresenta un set di codice che può essere eseguito in modo indipendente ed eseguire un'attività di Machine Learning, in base agli input necessari. Un componente può contenere un particolare algoritmo o eseguire un'attività importante in Machine Learning, ad esempio la sostituzione di valori mancanti o l'analisi statistica.
Per assistenza nella scelta degli algoritmi, vedere:
- Come selezionare gli algoritmi
- Scheda di riferimento rapido sugli algoritmi di Azure Machine Learning
Suggerimento
In qualsiasi pipeline della finestra di progettazione è possibile ottenere informazioni su un componente specifico. Selezionare il collegamento Altre informazioni nella scheda componente quando si passa il puntatore del mouse sul componente nell'elenco dei componenti o nel riquadro destro del componente.
Componenti di preparazione dei dati
Funzionalità | Descrizione | component |
---|---|---|
Dati di input e di output | Spostano i dati da origini cloud nella pipeline. Scrivere i risultati o i dati intermedi in Archiviazione di Azure o database SQL durante l'esecuzione di una pipeline o usare l'archiviazione cloud per scambiare dati tra pipeline. | Enter Data Manually (Immissione manuale dei dati) Esportazione dei dati Importazione dei dati |
Trasformazioni dei dati | Operazioni su dati specifici per l'apprendimento automatico, ad esempio la normalizzazione o il binning dei dati, la riduzione della dimensionalità e la conversione dei dati tra vari formati di file. | Aggiungi colonne Add Rows (Aggiungi righe) Apply Math Operation (Applica operazione matematica) Apply SQL Transformation (Applica trasformazione SQL) Clean Missing Data (Pulisci dati mancanti) Clip Values (Ritaglia valori) Convert to CSV (Converti in CSV) Convert to Dataset (Converti in set di dati) Convert to Indicator Values (Converti in valori indicatore) Edit Metadata (Modifica metadati) Group Data into Bins (Raggruppa dati in contenitori) Join Data (Unisci dati) Normalize Data (Normalizza dati) Partition and Sample (Crea partizioni ed esegui campionamenti) Remove Duplicate Rows (Rimuovi righe duplicate) SMOTE Select Columns Transform (Seleziona trasformazione colonne) Select Columns in Dataset (Seleziona colonne nel set di dati) Dividere dati |
Selezione funzionalità | Selezionare un subset di funzionalità pertinenti e utili da usare per creare un modello analitico. | Filter Based Feature Selection (Selezione caratteristiche basata su filtro) Permutation Feature Importance (Importanza caratteristica permutazione) |
Funzioni di statistiche | Offrono un'ampia gamma di metodi statistici correlati al data science. | Summarize Data (Riepiloga dati) |
Algoritmi di apprendimento automatico
Funzionalità | Descrizione | component |
---|---|---|
Regressione | Prevede un valore. | Boosted Decision Tree Regression (Regressione albero delle decisioni con boosting) Decision Forest Regression (Regressione foresta delle decisioni) Regressione quantile della foresta veloce Linear Regression (Regressione lineare) Neural Network Regression (Regressione rete neurale) Regressione poisson |
Cluster | Raggruppa i dati. | Clustering K-Means |
Classificazione | Prevedono una classe. Scegliere tra algoritmi binari (a due classi) o multiclasse. | Albero delle decisioni incrementato a più classi Foresta delle decisioni multiclasse Regressione logistica multiclasse Rete neurale multiclasse Una e tutte le multiclassi Uno e uno multiclasse Percettrone medio a due classi Albero delle decisioni incrementato a due classi Foresta delle decisioni a due classi Regressione logistica a due classi Rete neurale a due classi Two Class Support Vector Machine (Macchina a vettori di supporto a due classi) |
Componenti per la compilazione e la valutazione di modelli
Funzionalità | Descrizione | component |
---|---|---|
Training del modello | Eseguono i dati tramite l'algoritmo. | Train Clustering Model (Training del modello di clustering) Eseguire il training del modello Eseguire il training del modello Pytorch Tune Model Hyperparameters (Ottimizza iperparametri del modello) |
Valutazione e assegnazione di punteggi al modello | Misurano l'accuratezza del modello sottoposto a training. | Applica trasformazione Assign Data to Clusters (Assegna dati ai cluster) Cross Validate Model (Convalida incrociata modello) Evaluate Model (Valuta modello) Score Image Model Score Model (Punteggio modello) |
Linguaggio di Python | Scrivere codice e incorporarlo in un componente per integrare Python con la pipeline. | Create Python Model (Crea modello Python) Execute Python Script (Esegui script Python) |
Linguaggio di R | Scrivere codice e incorporarlo in un componente per integrare R con la pipeline. | Execute R Script (Esegui script R) |
Analisi del testo | Forniscono strumenti di calcolo specializzati per usare testo strutturato e non strutturato. | Convert Word to Vector (Converti parola in vettore) Extract N Gram Features from Text (Estrai caratteristiche n-gramma da testo) Hashing di funzioni Preprocess Text (Preelabora il testo) Latent Dirichlet Allocation (Allocazione Dirichlet latente) Score Vowpal Wabbit Model Eseguire il training del modello Vowpal Wabbit |
Visione artificiale | Pre-elaborazione dei dati delle immagini e componenti correlati al riconoscimento delle immagini. | Applica trasformazione immagine Converti in directory di immagini Trasformazione Immagine Init Split Image Directory DenseNet ResNet |
Elemento consigliato | Creano modelli di raccomandazione. | Evaluate Recommender (Valuta modelo di raccomandazione) Score SVD Recommender (Punteggio modulo di raccomandazione SVD) Punteggio wide e deep recommender Train SVD Recommender (Training modulo di raccomandazione SVD) Train Wide and Deep Recommender |
Rilevamento di anomalie | Creano modelli di rilevamento delle anomalie. | PCA-Based Anomaly Detection (Rilevamento anomalie basato su PCA) Train Anomaly Detection Model (Training modello di rilevamento anomalie) |
Servizio Web
Informazioni sui componenti del servizio Web necessari per l'inferenza in tempo reale nella finestra di progettazione di Azure Machine Learning.
Messaggi di errore
Informazioni sui messaggi di errore e sui codici di eccezione che possono verificarsi usando i componenti nella finestra di progettazione di Azure Machine Learning.
Ambiente componenti
Tutti i componenti predefiniti della finestra di progettazione verranno eseguiti in un ambiente fisso fornito da Microsoft.
In precedenza questo ambiente era basato su Python 3.6 e ora è stato aggiornato a Python 3.8. Questo aggiornamento è trasparente, in quanto i componenti verranno eseguiti automaticamente nell'ambiente Python 3.8 senza alcun intervento dell'utente. L'aggiornamento dell'ambiente può influire sugli output dei componenti e sulla distribuzione di endpoint in tempo reale da un'inferenza in tempo reale, vedere le sezioni seguenti per altre informazioni.
Gli output dei componenti sono diversi dai risultati precedenti
Dopo l'aggiornamento della versione di Python dalla versione 3.6 alla versione 3.8, le dipendenze dei componenti predefiniti possono essere aggiornate di conseguenza. Di conseguenza, è possibile che alcuni output dei componenti siano diversi dai risultati precedenti.
Se si usa il componente Execute Python Script e si dispone di pacchetti precedentemente installati associati a Python 3.6, è possibile che si verifichino errori come:
- "Impossibile trovare una versione che soddisfi il requisito".
- "Nessuna distribuzione corrispondente trovata". Sarà quindi necessario specificare la versione del pacchetto adattata a Python 3.8 ed eseguire di nuovo la pipeline.
Distribuire un endpoint in tempo reale da un problema di pipeline di inferenza in tempo reale
Se si distribuisce direttamente l'endpoint in tempo reale da una pipeline di inferenza in tempo reale completata precedente, potrebbero verificarsi errori.
Raccomandazione: clonare la pipeline di inferenza e inviarla di nuovo, quindi eseguire la distribuzione nell'endpoint in tempo reale.