Esportare dati

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Scrive un set di dati in varie forme di archiviazione basata sul cloud in Azure, ad esempio tabelle, BLOB e Azure SQL database

Categoria: Input e output dei dati

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Panoramica del modulo

Questo articolo descrive come usare il modulo Esporta dati in Machine Learning Studio (versione classica) per salvare risultati, dati intermedi e dati di lavoro dagli esperimenti in destinazioni di archiviazione cloud all'esterno di Machine Learning Studio (versione classica).

Questo modulo supporta l'esportazione o il salvataggio dei dati nei servizi dati cloud seguenti:

  • Esporta in query Hive: scrivere dati in una tabella Hive in un cluster Hadoop HDInsight.

  • Esporta in database SQL di Azure: salva i dati in database SQL di Azure o in Azure SQL Data Warehouse.

  • Esporta in tabella di Azure: salvare i dati nel servizio di archiviazione tabelle in Azure. L'archiviazione tabelle è buona per l'archiviazione di grandi quantità di dati. Fornisce un formato tabulare scalabile, economico e a disponibilità elevata.

  • Esporta in Archiviazione BLOB di Azure: salva i dati nel servizio BLOB in Azure. Questa opzione è utile per le immagini, il testo non strutturato o i dati binari. I dati nel servizio Blob possono essere condivisi pubblicamente o salvati in archivi dati protetti dell'applicazione.

Nota

Il modulo Esporta dati non supporta la connessione all'account di archiviazione BLOB di Azure se è abilitata l'opzione "Trasferimento sicuro obbligatorio".

  • Scaricare i dati: Per scaricare i dati in modo da poterli aprire in Excel o in un'altra applicazione, usare un modulo come Converti in CSV o Converti in TSV per preparare i dati in un formato specifico e quindi scaricare i dati.

  • È possibile scaricare i risultati di qualsiasi modulo che restituisce un set di dati facendo clic con il pulsante destro del mouse sull'output e scegliendo Scarica set di dati. Per impostazione predefinita, i dati vengono esportati in formato CSV.

  • Scaricare una definizione di modulo o un grafo dell'esperimento: Una nuova libreria di PowerShell consente di scaricare i metadati completi per l'esperimento o i dettagli per un modulo specifico. PowerShell per la Machine Learning è una versione sperimentale, ma include molti cmdlet utili:

    • Get-AmlExperiment elenca tutti gli esperimenti in un'area di lavoro.
    • Export-AmlExperimentGraph esporta una definizione dell'esperimento completo in un file JSON.
    • Download-AmlExperimentNodeOutput consente di estrarre le informazioni fornite sulle porte di output di qualsiasi modulo.

Come configurare l'esportazione dei dati

  1. Aggiungere il modulo Esporta dati all'esperimento in Studio (versione classica). È possibile trovare questo modulo nella categoria Input e output.

  2. Connessione esportare i dati nel modulo che contiene i dati da esportare.

  3. Fare doppio clic su Esporta dati per aprire il riquadro Proprietà.

  4. Per Destinazione dati selezionare il tipo di archiviazione cloud in cui si salveranno i dati. Se si apportano modifiche a questa opzione, tutte le altre proprietà vengono reimpostate. Assicurarsi quindi di scegliere prima questa opzione.

  5. Specificare il nome dell'account e il metodo di autenticazione necessari per accedere all'account di archiviazione specificato.

    A seconda del tipo di archiviazione e se l'account è protetto, potrebbe essere necessario specificare il nome dell'account, il tipo di file, la chiave di accesso o il nome del contenitore. Per le origini che non richiedono l'autenticazione, in genere è sufficiente conoscere l'URL.

    Per esempi di ogni tipo, vedere gli argomenti seguenti:

  6. L'opzione Usa risultati memorizzati nella cache consente di ripetere l'esperimento senza riscrivere gli stessi risultati ogni volta.

    Se si deseleziona questa opzione, i risultati vengono scritti nell'archiviazione ogni volta che viene eseguito l'esperimento, indipendentemente dal fatto che i dati di output siano stati modificati.

    Se si seleziona questa opzione, l'esportazione dei dati usa i dati memorizzati nella cache, se disponibili. I nuovi risultati vengono generati solo quando è presente una modifica upstream che influisce sui risultati.

  7. Eseguire l'esperimento.

Esempio

Per esempi su come usare il modulo Esporta dati, vedere il Azure AI Gallery:

  • Classificazione del testo: questo esempio usa Esporta dati per salvare i risultati intermedi e quindi usa Importa dati per ottenerli dall'archiviazione per i passaggi successivi dell'esperimento.

  • Retail Forecasting Step 1 of 6 - data preprocessing (Passaggio 1 di 6- pre-elaborazione dei dati): il modello di previsione delle vendite al dettaglio illustra un'attività di Machine Learning basata sui dati archiviati in database SQL di Azure. Illustra diverse tecniche utili, ad esempio come creare un database Azure SQL per Machine Learning, usando il database Azure SQL per passare set di dati tra esperimenti in account diversi, salvando e combinando le previsioni.

  • Compilare e distribuire un modello di Machine Learning usando SQL Server in una macchina virtuale di Azure: questo articolo illustra come usare un database SQL Server ospitato in una macchina virtuale di Azure come origine per archiviare i dati di training e le stime generate dall'esperimento. Illustra anche come usare il database relazionale per la progettazione delle funzionalità e la selezione delle funzionalità.

  • Come usare Azure ML con Azure SQL Data Warehouse: questo articolo illustra come creare un modello di Machine Learning usando i dati in Azure SQL Data Warehouse.

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Dettagli dell'implementazione

  • Questo modulo è stato denominato in precedenza Writer. Se si dispone di un esperimento esistente che usa il modulo Writer , il modulo viene rinominato in Esporta dati quando si aggiorna l'esperimento.

  • Non tutti i moduli producono un output compatibile con le destinazioni export data. Ad esempio, l'esportazione di dati non può salvare un set di dati convertito nel formato SVMLight. Export Data supporta i formati seguenti:

    • Set di dati (formato interno ML Azure)
    • DataTable .NET
    • CSV con o senza intestazioni
    • TSV con o senza intestazioni

Problemi noti

  • Quando si seleziona Tabella di Azure come percorso per l'output dei dati, occasionalmente potrebbe verificarsi un errore durante la scrittura nella tabella specificata. In questo caso, i dati potrebbero essere scritti in un BLOB.

    Se si verifica questo errore e successivamente non è possibile leggere dalla tabella prevista, provare a usare un'utilità di archiviazione di Azure per controllare i BLOB nel contenitore specificato nell'account di archiviazione.

  • Attualmente non è possibile salvare un BLOB in una tabella Hive specificata. Se è necessario scrivere risultati intermedi, evitare di usare una tabella Hive in HDInsight e usare invece l'archiviazione BLOB o l'archiviazione tabelle.

  • Attualmente, se si seleziona HDFS come percorso per salvare i dati di output, viene restituito questo messaggio di errore: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Input previsti

Nome Tipo Descrizione
Set di dati Tabella dati Set di dati da scrivere.

Parametri del modulo

In questa tabella sono elencati i parametri applicabili a tutte le opzioni esporta dati. Altri parametri sono dinamici e cambiano a seconda della destinazione dati selezionata.

Nome Intervallo Type Predefinito Descrizione
Please specify data destination Elenco DataSourceOrSink Servizio BLOB in Archiviazione di Azure Indicare se la destinazione dati è un file nel servizio BLOB, un file nel servizio tabelle, undatabase SQL in Azure o una tabella Hive.
Usare i risultati memorizzati nella cache VERO/FALSO Boolean FALSE Selezionare questa opzione per evitare di riscrivere i risultati inutilmente. Se qualcosa cambia a monte nell'esperimento, l'esportazione dei dati verrà sempre eseguita e scriverà nuovi risultati. Tuttavia, se non è stato modificato nulla ed è stata selezionata questa opzione, l'esportazione dei dati non verrà eseguita per evitare di riscrivere gli stessi risultati.

Eccezioni

Eccezione Descrizione
Errore 0057 Viene generata un'eccezione quando si tenta di creare un file o un BLOB che esiste già.
Errore 0001 Si verifica un'eccezione se non è possibile trovare una o più colonne specificate del set di dati.
Errore 0027 Si verifica un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti.
Errore 0079 Viene generata un'eccezione se il nome del contenitore in Archiviazione di Azure non è stato specificato correttamente.
Errore 0052 Viene generata un'eccezione se la chiave di accesso alle risorse di archiviazione per l'account Azure non è stata specificata correttamente.
Errore 0064 Viene generata un'eccezione se il nome dell'account o la chiave di accesso alle risorse di archiviazione per l'account Azure non è stata specificata correttamente.
Errore 0071 Viene generata un'eccezione se le credenziali specificate non sono corrette.
Errore 0018 Si verifica un'eccezione se il set di dati di input non è valido.
Errore 0029 Viene generata un'eccezione quando viene passato un URI non valido.
Errore 0003 Si verifica un'eccezione se uno o più input sono Null o vuoti.

Per un elenco degli errori specifici dei moduli di Studio (versione classica), vedere Machine Learning codici di errore.

Per un elenco delle eccezioni API, vedere Machine Learning di errore dell'API REST.

Vedi anche

Importazione dei dati
Input e output dei dati
Trasformazioni dei dati
Archiviazione tabelle di Azure e database SQL di Azure: Confronto e contrapposizioni
Elenco moduli A-Z