Esportare i dati in Archiviazione BLOB di Azure
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive come usare l'opzione Esporta in Archiviazione BLOB di Azure, nel modulo Esporta dati in Machine Learning Studio (versione classica).
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Questa opzione è utile quando si vogliono esportare i dati da un esperimento di Machine Learning Archiviazione BLOB di Azure. Ad esempio, è possibile condividere gli output dei dati di Machine Learning con altre applicazioni o archiviare dati intermedi o set di dati puliti da usare in altri esperimenti.
È possibile accedere ai BLOB di Azure da qualsiasi posizione, tramite HTTP o HTTPS. Poiché Archiviazione BLOB di Azure è un archivio dati non strutturato, è possibile esportare i dati in vari formati. Attualmente sono supportati i formati CSV, TSV e ARFF.
Per esportare i dati nel BLOB di Azure per l'uso da parte di altre applicazioni, usare il modulo Export Data (Esporta dati) per salvare i dati Archiviazione BLOB di Azure. Usare quindi qualsiasi strumento in grado di leggere i dati da Archiviazione di Azure, ad esempio Excel, utilità di archiviazione cloud o altri servizi cloud, per caricare e usare i dati.
Nota
I moduli Import Data (Importa dati ) ed Export Data (Esporta dati) possono leggere e scrivere dati solo dall'archiviazione di Azure creata usando il modello di distribuzione classica. In altre parole, il nuovo tipo di account Archiviazione BLOB di Azure che offre livelli di accesso ad accesso più caldo e ad accesso limitato non è ancora supportato.
In genere gli account di archiviazione di Azure creati prima che fosse disponibile questa opzione non dovrebbero essere influenzati.
Tuttavia, se è necessario creare un nuovo account da usare con Machine Learning, è consigliabile selezionare Classica per Modello di distribuzione oppure usare Gestione risorse e per Tipo di account selezionare Utilizzo generico anziché Archiviazione BLOB.
Come esportare i dati in Archiviazione BLOB di Azure
Il servizio BLOB di Azure è per l'archiviazione di grandi quantità di dati, inclusi i dati binari. Esistono due tipi di archiviazione BLOB: BLOB pubblici e BLOB che richiedono credenziali di accesso.
Aggiungere il modulo Export Data (Esporta dati) all'esperimento. È possibile trovare questo modulo nella categoria Input e output dei dati in Studio (versione classica).
Connessione esportare i dati nel modulo che produce i dati da esportare in Archiviazione BLOB di Azure.
Aprire il riquadro Proprietà di Esporta dati. Per la destinazione dei dati, selezionare Archiviazione BLOB di Azure.
Per Tipo di autenticazione scegliere Pubblico (URL di firma di accesso condiviso) se si è a sapere che l'archiviazione supporta l'accesso tramite un URL di firma di accesso condiviso.
Un URL di firma di accesso condiviso è un tipo speciale di URL che può essere generato tramite un'utilità di archiviazione di Azure ed è disponibile solo per un periodo di tempo limitato. Contiene tutte le informazioni necessarie per l'autenticazione e il download.
Per URI digitare o incollare l'URI completo che definisce l'account e il BLOB pubblico.
Per gli account privati, scegliere Account e specificare il nome dell'account e la chiave dell'account, in modo che l'esperimento possa scrivere nell'account di archiviazione.
Nome account: digitare o incollare il nome dell'account in cui si vogliono salvare i dati. Ad esempio, se l'URL completo dell'account di archiviazione è
https://myshared.blob.core.windows.net
, digitaremyshared
.Chiave dell'account: incollare la chiave di accesso alle risorse di archiviazione associata all'account.
Percorso del contenitore, della directory o del BLOB: digitare il nome del BLOB in cui verranno archiviati i dati esportati. Ad esempio, per salvare i risultati dell'esperimento in un nuovo BLOB denominato results01.csv nelle stime del contenitore in un account denominato mymldata, l'URL completo per il BLOB sarà
https://mymldata.blob.core.windows.net/predictions/results01.csv
.Pertanto, nel campo Percorso del contenitore, della directory o del BLOB è necessario specificare il nome del contenitore e del BLOB come indicato di seguito:
predictions/results01.csv
Se si specifica il nome di un BLOB che non esiste già, Azure crea automaticamente il BLOB.
Quando si scrive in un BLOB esistente, è possibile specificare che il contenuto corrente del BLOB deve essere sovrascritto impostando la proprietà Archiviazione BLOB di Azure modalità di scrittura. Per impostazione predefinita, questa proprietà è impostata su Error, vale a dire che viene generato un errore ogni volta che viene trovato un file BLOB esistente con lo stesso nome.
In Formato file per file BLOB selezionare il formato in cui archiviare i dati.
CSV: i valori delimitati da virgole (CSV) sono il formato di archiviazione predefinito. Per esportare le intestazioni di colonna insieme ai dati, selezionare l'opzione Scrivi riga intestazione BLOB. Per altre informazioni sul formato delimitato da virgole usato in Machine Learning, vedere Convertire in CSV.
TSV: il formato TSV (Tab-Separated Values) è compatibile con molti strumenti di Machine Learning. Per esportare le intestazioni di colonna insieme ai dati, selezionare l'opzione Scrivi riga intestazione BLOB. Per altre informazioni sul formato delimitato da tabulazioni usato in Machine Learning, vedere Convertire in TSV.
ARFF: questo formato supporta il salvataggio di file nel formato usato dal set di strumenti Weka. Questo formato non è supportato per i file archiviati in un URL di firma di accesso condiviso. Per altre informazioni sul formato ARFF, vedere Convertire in ARFF.
Usa risultati memorizzati nella cache: selezionare questa opzione se si vuole evitare di riscrivere i risultati nel file BLOB ogni volta che si esegue l'esperimento. Se non sono presenti altre modifiche ai parametri del modulo, l'esperimento scrive i risultati solo alla prima esecuzione del modulo o in caso di modifiche ai dati.
Esempio
Per esempi su come usare il modulo Export Data (Esporta dati), vedere il Azure AI Gallery:
Convert Dataset to VW Format (Converti set di dati in formato VW): questo esperimento usa lo script Python insieme al modulo Export Data (Esporta dati) per creare dati che possono essere usati da Vowpal Wabbit.
Configurazione di pipeline di analisi predittiva usando Azure SQL Data Warehouse: questo scenario descrive lo spostamento dei dati tra più componenti, tra cui Machine Learning e SQL Data Warehouse.
Assegnazione di punteggi batch senza codice: questa esercitazione illustra come usare App per la logica di Azure per automatizzare sia l'importazione dei dati usati dagli esperimenti che la scrittura dei risultati dell'esperimento nell'archivio BLOB.
Operationalize Azure ML solution with On-premise SQL Server using Azure data factory :Questo articolo descrive una pipeline di dati più complessa che invia i dati a un database SQL Server locale, usando l'archiviazione BLOB come fase provvisoria. L'uso di un database locale richiede la configurazione di un gateway dati, ma è possibile ignorare questa parte dell'esempio e usare semplicemente l'archiviazione BLOB.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Domande frequenti
Come è possibile evitare di scrivere i dati se l'esperimento non è stato modificato
Quando i risultati dell'esperimento cambiano, Esporta dati salva sempre il nuovo set di dati. Tuttavia, se l'esperimento viene eseguito ripetutamente senza apportare modifiche che influiscono sui dati di output, è possibile selezionare l'opzione Usa risultati memorizzati nella cache .
Il modulo controlla se l'esperimento è stato eseguito in precedenza usando gli stessi dati e le stesse opzioni e, se viene trovata un'esecuzione precedente, l'operazione di scrittura non viene ripetuta.
È possibile salvare i dati in un account in un'area geografica diversa
Sì, è possibile scrivere dati in account in aree diverse. Tuttavia, se l'account di archiviazione si trova in un'area diversa dal nodo di calcolo usato per l'esperimento di Machine Learning, l'accesso ai dati potrebbe essere più lento. Vengono inoltre addebitati i costi per i dati in ingresso e in uscita nella sottoscrizione.
Parametri del modulo
Opzioni generali
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Origine dati | Elenco | Origine dati o sink | Archiviazione BLOB di Azure | La destinazione può essere un file nell'archivio BLOB di Azure, una tabella di Azure, una tabella o una vista in un database SQL di Azure o una tabella Hive. |
Usare i risultati memorizzati nella cache | VERO/FALSO | Boolean | FALSE | Il modulo viene eseguito solo se non esiste una cache valida. in caso contrario, usare i dati memorizzati nella cache dell'esecuzione precedente. |
Please specify authentication type | FIRMA DI ACCESSO CONDIVISO/Account | AuthenticationType | Account | Indica se usare la firma di accesso condiviso o le credenziali dell'account per l'autorizzazione di accesso |
Public o SAS - Opzioni di archiviazione pubblica
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
SAS URI for blob | any | string | Nessuno | URI di firma di accesso condiviso del BLOB in cui scrivere (obbligatorio) |
File format for SAS file | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Indica se il file è CSV, TSV o ARFF. (obbligatorio) |
Write SAS header row | VERO/FALSO | Boolean | FALSE | Indica se le intestazioni di colonna devono essere scritte nel file |
Account - Opzioni di archiviazione privata
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Azure account name | any | string | Nessuno | Nome dell'account utente di Azure |
Azure account key | any | SecureString | Nessuno | Chiave di archiviazione di Azure |
Path to blob beginning with container | any | string | Nessuno | Nome del file BLOB, che inizia con il nome del contenitore |
Archiviazione BLOB di Azure di scrittura | Elenco: Errore, Sovrascrittura | enum:BlobFileWriteMode | Errore | Scegliere il metodo di scrittura dei file BLOB |
File format for blob file | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Indica se il file BLOB è CSV, TSV o ARFF |
Write blob header row | VERO/FALSO | Boolean | FALSE | Indica se il file BLOB deve avere una riga di intestazione |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0027 | Viene generata un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti. |
Errore 0003 | Si verifica un'eccezione se uno o più input sono Null o vuoti. |
Errore 0029 | Viene generata un'eccezione quando viene passato un URI non valido. |
Errore 0030 | Viene generata un'eccezione se non è possibile scaricare un file. |
Errore 0002 | Viene generata un'eccezione se non è stato possibile analizzare o convertire uno o più parametri dal tipo specificato nel tipo richiesto dal metodo di destinazione. |
Errore 0009 | Viene generata un'eccezione se il nome dell'account di Archiviazione di Azure o il nome del contenitore non è stato specificato correttamente. |
Errore 0048 | Viene generata un'eccezione quando non è possibile aprire un file. |
Errore 0046 | Viene generata un'eccezione quando non è possibile creare una directory nel percorso specificato. |
Errore 0049 | Viene generata un'eccezione quando non è possibile analizzare un file. |
Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.
Vedi anche
Importazione dei dati
Esportazione dei dati
Esportare in database SQL di Azure
Esportare in una query Hive
Esportare in una tabella di Azure