Esportare in una tabella di Azure

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Questo articolo descrive come usare l'opzione Esporta in Azure nel modulo Esporta dati in Machine Learning Studio (versione classica).

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Questa opzione è utile quando si vogliono esportare i risultati o i dati intermedi da un esperimento di Machine Learning a una tabella di Azure. Il servizio tabelle di Azure è un servizio di gestione dati in Azure in grado di archiviare grandi quantità di dati strutturati non relazionali. Si tratta di un archivio dati NoSQL che accetta chiamate autenticate dall'interno e dall'esterno di Azure.

Come esportare dati in una tabella di Azure

  1. Aggiungere il modulo Esporta dati all'esperimento. È possibile trovare questo modulo nella categoria Input e output dati in Studio (versione classica).

  2. Connessione nel modulo che produce i dati da esportare nell'archiviazione tabelle di Azure.

  3. Specificare se si desidera esportare i dati in una risorsa condivisa pubblica o in un account di archiviazione privato che richiede credenziali di accesso, impostando l'opzione Tipo di autenticazione.

    • Pubblico (URL di firma di accesso condiviso): scegliere questa opzione se l'account supporta l'accesso tramite URL di firma di accesso condiviso. Nel campo TABLE SAS URI (URI firma di accesso condiviso tabella) digitare o incollare l'URI completo che definisce l'account e il BLOB pubblico.

      L'URL di firma di accesso condiviso è un URL di accesso associato al tempo che è possibile generare usando un'utilità di archiviazione di Azure. In una pagina accessibile tramite URL di firma di accesso condiviso, i dati possono essere archiviati usando solo questi formati: CSV, TSV e ARFF.

    • Account: scegliere questa opzione se i dati si trova in un account privato. È anche necessario specificare le credenziali, inclusi il nome dell'account e la chiave.

  4. Se si vogliono esportare i dati nell'archiviazione privata protetta, specificare le credenziali necessarie per accedere all'account:

    • Nome account tabella: digitare o incollare il nome dell'account che contiene il BLOB a cui si vuole accedere. Ad esempio, se l'URL completo dell'account di archiviazione è https://myshared.table.core.windows.net, digitare myshared.

    • Chiave dell'account di tabella: incollare la chiave di accesso associata all'account di archiviazione.

    • Nome tabella: digitare il nome della tabella specifica che si vuole leggere.

  5. Specificare le colonne da salvare nell'archivio tabelle e le colonne da usare nella definizione dello schema della tabella usando le proprietà della colonna.

    • Chiave di partizione: scegliere la colonna da usare per il partizionamento del set di dati salvato per la tabella Archiviazione di Azure. Le tabelle in Azure sono partizionate per supportare il bilanciamento del carico tra i nodi di archiviazione. Tutte le entità di tabella sono organizzate in base alla partizione. Pertanto, la proprietà PartitionKey è obbligatoria per tutte le operazioni di tabella.

    • Chiave di riga della tabella di Azure: scegliere la colonna da usare per la proprietà RowKey . La proprietà RowKey è una proprietà di sistema necessaria per ogni entità in una tabella. Insieme alla proprietà PartitionKey , forma un indice univoco per ogni riga della tabella.

    Nota

    È necessario usare colonne diverse per RowKey e PartitionKey. Assicurarsi che qualsiasi colonna selezionata per RowKey o PartitionKey sia inclusa anche nell'elenco delle colonne di destinazione oppure viene generato un errore.

    • Colonne di origine della tabella di Azure: selezionare eventuali colonne aggiuntive del set di dati da salvare nella tabella di Azure. È anche necessario includere le colonne selezionate per PartitionKey e RowKey.

    Per altre informazioni sulle tabelle in Archiviazione di Azure, vedere Informazioni sul modello di dati del servizio tabelle.

  6. Specificare i nomi delle colonne da scrivere nella tabella.

    Importante

    È necessario specificare un nome di colonna per ogni colonna restituita nella tabella, incluse le colonne RowKey, PartitionKey e tutte le colonne di origine.

    Se il numero di nomi di colonna specificati non corrisponde al numero di colonne di output, viene generato un errore.

    Se si digitano nuovi nomi di colonna, questi devono essere specificati nell'ordine degli indici di colonna delle colonne di origine.

  7. Modalità di scrittura tabelle di Azure: indicare il comportamento dell'esportazione dei dati quando i dati sono già presenti nella tabella di Azure.

    • Inserisci: l'operazione Insert Entity inserisce una nuova entità con una chiave primaria univoca, formata da una combinazione delle proprietà PartitionKey e RowKey .

    • Merge: l'operazione Merge Entity aggiorna un'entità esistente aggiornando le proprietà dell'entità. Questa operazione non sostituisce l'entità esistente.

    • Replace: l'operazione Update Entity sostituisce il contenuto dell'entità specificata in una tabella.

    • InsertOrReplace: l'operazione InsertOrReplace Entity inserisce l'entità se l'entità non esiste. Se invece l'entità esiste, la sostituisce.

    • InsertOrMerge: l'operazione InsertOrMerge Entity inserisce l'entità se l'entità non esiste. Se invece l'entità esiste, unisce le proprietà specificate dell'entità con quelle già esistenti.

  8. Usa risultati memorizzati nella cache: indicare se si vuole aggiornare i dati ogni volta che viene eseguito l'esperimento.

    Se si seleziona questa opzione, il modulo Esporta dati salva i dati nella tabella specificata alla prima esecuzione dell'esperimento e successivamente non esegue operazioni di scrittura, a meno che non siano presenti modifiche upstream.

    Se si deseleziona questa opzione, i dati vengono scritti nella destinazione ogni volta che viene eseguito l'esperimento, indipendentemente dal fatto che i dati siano uguali o meno.

  9. Eseguire l'esperimento.

Note tecniche

Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.

Domande frequenti

Perché è stato visualizzato un errore durante la scrittura in una tabella esistente

Controllare lo schema della tabella per assicurarsi che i nomi delle colonne e i tipi di dati siano uguali. Ad esempio, nell'archiviazione tabelle di Azure la colonna ID deve essere una stringa.

Se viene visualizzato l'errore 0027: le dimensioni degli oggetti passati non sono coerenti, verificare che la tabella esista nel contenitore specificato. Attualmente Azure ML può scrivere solo in tabelle esistenti.

Perché viene visualizzato l'errore che indica che non è possibile trovare una colonna esistente

Se l'esperimento non è stato eseguito, le colonne upstream talvolta non vengono rilevate dall'esportazione dei dati. Se si apportano modifiche upstream nell'esperimento, potrebbe essere necessario rimuovere il modulo Esporta dati e quindi aggiungerlo e riconfigurarlo.

Come è possibile evitare di ri-scrivere gli stessi dati inutilmente

Se i dati nell'esperimento cambiano per qualsiasi motivo, il modulo Esporta dati scriverà sempre i nuovi dati.

Tuttavia, se si esegue l'esperimento con altre modifiche che non influiscono sui risultati, impostare l'opzione Usa risultati memorizzati nella cache su TRUE. Il modulo verifica se l'esperimento è stato eseguito in precedenza usando le stesse opzioni e, se viene trovato un risultato precedente, i dati non verranno scritti nella tabella di Azure.

È possibile esportare i dati in un'area geografica diversa

Sì. Tuttavia, se l'account di archiviazione si trova in un'area diversa dal nodo di calcolo usato per l'esperimento di Machine Learning, l'accesso ai dati potrebbe essere più lento. Inoltre, vengono addebitati i dati in ingresso e in uscita nella sottoscrizione.

Esempio

Per esempi su come usare questi moduli di Machine Learning, vedere l'Azure AI Gallery.

Parametri del modulo

Public o SAS - Opzioni pubbliche

Nome Intervallo Type Predefinito Descrizione
Table SAS URI any string

Account - Opzioni dell'account privato

Nome Intervallo Type Predefinito Descrizione
Table account name
Table account key any SecureString

Opzioni di archiviazione

Nome Intervallo Type Predefinito Descrizione
Nome tabella string Nessuno
Chiave di partizione any SecureString Nessuno Scegliere la colonna da usare come chiave durante il partizionamento della tabella. Se non è selezionata alcuna colonna, il nome della colonna come chiave di partizione per tutte le voci
Azure table row key any ColumnPicker Nessuno Scegliere la colonna che contiene l'identificatore univoco per le righe della tabella. Il valore predefinito è una chiave di riga basata su GUID
Azure table origin columns any ColumnPicker Nessuno Specificare le colonne da includere nella tabella, in base al nome o all'indice di colonna
Azure table destination columns any string Nessuno Digitare i nomi delle colonne da utilizzare nella tabella di destinazione
Azure table write mode Elenco: Insert, Merge, Replace, InsertOrReplace, InsertOrMerge Enumerazione Nessuno
Usare i risultati memorizzati nella cache VERO/FALSO Boolean FALSE Il modulo viene eseguito solo se non esiste una cache valida. in caso contrario, usare i dati memorizzati nella cache dell'esecuzione precedente.

Eccezioni

Eccezione Descrizione
Errore 0027 Viene generata un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti.
Errore 0003 Si verifica un'eccezione se uno o più input sono Null o vuoti.
Errore 0029 Viene generata un'eccezione quando viene passato un URI non valido.
Errore 0030 Viene generata un'eccezione se non è possibile scaricare un file.
Errore 0002 Viene generata un'eccezione se non è stato possibile analizzare o convertire uno o più parametri dal tipo specificato nel tipo richiesto dal metodo di destinazione.
Errore 0009 Viene generata un'eccezione se il nome dell'account di Archiviazione di Azure o il nome del contenitore non è stato specificato correttamente.
Errore 0048 Viene generata un'eccezione quando non è possibile aprire un file.
Errore 0046 Viene generata un'eccezione quando non è possibile creare una directory nel percorso specificato.
Errore 0049 Viene generata un'eccezione quando non è possibile analizzare un file.

Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.

Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.

Vedi anche

Importazione dei dati
Esportazione dei dati
Esportare in database SQL di Azure
Esportare i dati in Archiviazione BLOB di Azure
Esportare in una query Hive