Importare da una tabella di Azure
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive come usare il modulo Importa dati in Machine Learning Studio (versione classica) per importare dati strutturati o semistrutturati dalle tabelle di Azure in un esperimento di Machine Learning.
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Il servizio tabelle di Azure è un servizio di gestione dati in Azure in grado di archiviare grandi quantità di dati strutturati non relazionali. Si tratta di un archivio dati NoSQL che accetta chiamate autenticate dall'interno e dall'esterno di Azure.
Per l'importazione da Archiviazione tabelle di Azure è necessario scegliere uno dei due tipi di account: un account di archiviazione accessibile tramite un URL di firma di accesso condiviso o un account di archiviazione privato che richiede credenziali di accesso.
Come importare dati da tabelle di Azure
Usare l'Importazione guidata dati
Il modulo include una nuova procedura guidata che consente di scegliere un'opzione di archiviazione, selezionare tra sottoscrizioni e account esistenti e configurare rapidamente tutte le opzioni.
Aggiungere il modulo Importa dati all'esperimento. È possibile trovare il modulo in Input e output dei dati.
Fare clic su Avvia Importazione guidata dati e seguire le istruzioni visualizzate.
Al termine della configurazione, per copiare effettivamente i dati nell'esperimento, fare clic con il pulsante destro del mouse sul modulo e scegliere Esegui selezionato.
Se è necessario modificare una connessione dati esistente, la procedura guidata carica tutti i dettagli di configurazione precedenti in modo che non sia necessario ricominciare da zero
Impostare manualmente le proprietà nel modulo Importa dati
La procedura seguente descrive come configurare manualmente l'origine di importazione.
Aggiungere il modulo Importa dati all'esperimento. È possibile trovare questo modulo nel gruppo Input e output dati nell'elenco degli elementi dell'esperimento in Machine Learning Studio (versione classica).
Per Origine dati selezionare Tabella di Azure.
Per Tipo di autenticazione scegliere Pubblico (URL di firma di accesso condiviso) se si è a sapere che le informazioni sono state fornite come origine dati pubblica. Un URL di firma di accesso condiviso è un URL di accesso associato al tempo che è possibile generare usando un'utilità di archiviazione di Azure.
In caso contrario, scegliere Account.
Se i dati si trova in un BLOB pubblico accessibile tramite un URL di firma di accesso condiviso, non sono necessarie credenziali aggiuntive perché la stringa dell'URL contiene tutte le informazioni necessarie per il download e l'autenticazione.
Nel campo TABLE SAS URI (URI firma di accesso condiviso tabella) digitare o incollare l'URI completo che definisce l'account e il BLOB pubblico.
Nota
In una pagina accessibile tramite URL di firma di accesso condiviso, i dati possono essere archiviati usando solo questi formati: CSV, TSV e ARFF.
Se i dati si trova in un account privato, è necessario specificare le credenziali, inclusi il nome dell'account e la chiave.
In Nome account tabella digitare o incollare il nome dell'account che contiene il BLOB a cui si vuole accedere.
Ad esempio, se l'URL completo dell'account di archiviazione è
https://myshared.table.core.windows.net
, digitaremyshared
.Per Chiave dell'account di tabella incollare la chiave di accesso associata all'account di archiviazione.
Se non si conosce la chiave di accesso, vedere la sezione "Visualizzare, copiare e rigenerare le chiavi di accesso di archiviazione" in questo articolo: Informazioni sugli account Archiviazione di Azure archiviazione.
In Nome tabella digitare il nome della tabella specifica che si vuole leggere.
Scegliere un'opzione che indica il numero di righe da analizzare per l'importazione dei dati. Importa dati usa l'analisi per ottenere l'elenco delle colonne nei dati e per determinare i tipi di dati delle colonne.
TopN: analizza solo il numero specificato di righe, a partire dall'inizio del set di dati.
Per impostazione predefinita, vengono analizzate 10 righe, ma è possibile aumentare o ridurre tale valore usando l'opzione Conteggio righe per TopN .
Se i dati sono omogenei e prevedibili, selezionare TopN e immettere un numero per N. Per le tabelle di grandi dimensioni, ciò può comportare tempi di lettura più rapidi.
ScanAll: analizza tutte le righe nella tabella.
Se i dati sono strutturati con set di proprietà che variano in base alla profondità e alla posizione della tabella, scegliere l'opzione ScanAll per analizzare tutte le righe. Ciò garantisce l'integrità della conversione di metadati e proprietà risultante.
Indicare se si desidera aggiornare i dati ogni volta che viene eseguito l'esperimento. Se si seleziona l'opzione Usa risultati memorizzati nella cache (impostazione predefinita), il modulo Importa dati leggerà i dati nel formato dell'origine specificata alla prima esecuzione dell'esperimento e successivamente i risultati verranno memorizzati nella cache. Se vengono apportate modifiche ai parametri del modulo Importa dati, i dati vengono ricaricati.
Se si deseleziona questa opzione, i dati verranno letti dall'origine ogni volta che viene eseguito l'esperimento, indipendentemente dal fatto che i dati siano uguali o meno.
Esempio
Per esempi su come usare il modulo Esporta dati, vedere il Azure AI Gallery.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Domande frequenti
Come è possibile evitare di ricaricare inutilmente gli stessi dati?
Se i dati di origine cambiano, è possibile aggiornare il set di dati e aggiungere nuovi dati eseguendo nuovamente Importa dati. Tuttavia, se non si vuole ri-leggere dall'origine ogni volta che si esegue l'esperimento, selezionare l'opzione Usa risultati memorizzati nella cache su TRUE. Quando questa opzione è impostata su TRUE, il modulo verifica se l'esperimento è stato eseguito in precedenza usando la stessa origine e le stesse opzioni di input e, se viene trovata un'esecuzione precedente, vengono usati i dati nella cache, anziché ricaricare i dati dall'origine.
È possibile filtrare i dati durante la lettura dall'origine?
Il modulo Importa dati non supporta il filtro durante la lettura dei dati. L'eccezione è la lettura dai feed di dati, che talvolta consentono di specificare una condizione di filtro come parte dell'URL del feed.
Tuttavia, è possibile modificare o filtrare i dati dopo la lettura in Machine Learning Studio (versione classica):
- Usare uno script R personalizzato per modificare o filtrare i dati.
- Usare il modulo Dividi dati con un'espressione relativa o un'espressione regolare per isolare i dati desiderati e quindi salvarli come set di dati.
Nota
Se si ritiene di aver caricato più dati del necessario, è possibile sovrascrivere il set di dati memorizzato nella cache leggendo un nuovo set di dati e salvandolo con lo stesso nome del precedente set di dati più grande.
In che modo l'importazione dei dati gestisce i dati caricati da aree geografiche diverse?
Se l'account di archiviazione BLOB o tabelle si trova in un'area diversa dal nodo di calcolo usato per l'esperimento di Machine Learning, l'accesso ai dati potrebbe essere più lento. Inoltre, vengono addebitati i dati in ingresso e in uscita nella sottoscrizione.
Perché alcuni caratteri nella tabella non vengono visualizzati correttamente?
Machine Learning supporta la codifica UTF-8. Se la tabella usa un'altra codifica, i caratteri potrebbero non essere importati correttamente.
Sono presenti caratteri o caratteri non consentiti che vengono modificati durante l'importazione?
Se i dati degli attributi contengono virgolette o sequenze di caratteri di escape, vengono gestiti usando le regole per tali caratteri in Microsoft Excel. Tutti gli altri caratteri vengono gestiti usando le specifiche seguenti come linee guida: RFC 4180.
Parametri del modulo
Nome | Intervallo | Type | Predefinito | Predefinito |
---|---|---|---|---|
Origine dati | Elenco | Origine dati o sink | Archiviazione BLOB di Azure | L'origine dati può essere HTTP, FTP, HTTPS anonimo o FTPS, un file nell'archivio BLOB di Azure, una tabella di Azure, un database SQL di Azure, un database SQL Server locale, una tabella Hive o un endpoint OData. |
Tipo di autenticazione | PublicOrSas Account |
tableAuthType | Account | Specificare se i dati si trovano in un contenitore pubblico accessibile tramite URL di firma di accesso condiviso o in un account di archiviazione privato che richiede l'autenticazione per l'accesso. |
Public o SAS - Opzioni di archiviazione pubblica
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Table URI | any | string | ||
Rows to scan for property names via SAS | numero intero | |||
Rows count for TopN via SAS |
Account - Opzioni di archiviazione privata
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Table account name | ||||
Table account key | any | SecureString | ||
Nome tabella | any | |||
Rows to scan for property names | TopN ScanAll |
|||
Rows count for TopN | any | numero intero |
Output
Nome | Tipo | Descrizione |
---|---|---|
Set di dati di risultati | Tabella dati | Set di dati con dati scaricati |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0027 | Viene generata un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti. |
Errore 0003 | Si verifica un'eccezione se uno o più input sono Null o vuoti. |
Errore 0029 | Viene generata un'eccezione quando viene passato un URI non valido. |
Errore 0030 | Viene generata un'eccezione se non è possibile scaricare un file. |
Errore 0002 | Viene generata un'eccezione se non è stato possibile analizzare o convertire uno o più parametri dal tipo specificato nel tipo richiesto dal metodo di destinazione. |
Errore 0009 | Viene generata un'eccezione se il nome dell'account di Archiviazione di Azure o il nome del contenitore non è stato specificato correttamente. |
Errore 0048 | Viene generata un'eccezione quando non è possibile aprire un file. |
Errore 0046 | Viene generata un'eccezione quando non è possibile creare una directory nel percorso specificato. |
Errore 0049 | Viene generata un'eccezione quando non è possibile analizzare un file. |
Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.
Vedi anche
Importazione dei dati
Esportazione dei dati
Importazione da URL Web tramite HTTP
Importare da una query Hive
Importazione da Database SQL di Azure
Importare da Archiviazione BLOB di Azure
Importare da provider di feed di dati
Importare da un database SQL Server locale