Importazione da Database SQL di Azure
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive come usare il modulo Importa dati in Machine Learning Studio (versione classica) per ottenere dati da un database SQL di Azure o Azure SQL Data Warehouse.
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Per importare dati da un database, è necessario specificare sia il nome del server che il nome del database e un'istruzione SQL che definisce la tabella, la vista o la query.
In generale, l'archiviazione dei dati nei database di Azure è più costosa rispetto all'uso di tabelle o BLOB in Azure. Possono anche essere previsti limiti per la quantità di dati che è possibile archiviare in un database, a seconda del tipo di sottoscrizione. Tuttavia, non sono presenti costi di transazione SQL Azure Database, quindi questa opzione è ideale per l'accesso rapido a piccole quantità di informazioni usate di frequente, ad esempio tabelle di ricerca dati o dizionari dati.
È preferibile archiviare i dati in un database di Azure anche se è necessario poter filtrare i dati prima di leggerlo o se si vogliono salvare le stime o le metriche nel database per la creazione di report.
Come importare dati da database SQL di Azure o SQL Data Warehouse
Usare l'Importazione guidata dati
Il modulo include una nuova procedura guidata che consente di scegliere un'opzione di archiviazione, selezionare tra sottoscrizioni e account esistenti e configurare rapidamente tutte le opzioni.
Aggiungere il modulo Importa dati all'esperimento. È possibile trovare il modulo in Studio (versione classica), nella categoria Input e output dati.
Fare clic su Avvia Importazione guidata dati e seguire le istruzioni visualizzate.
Al termine della configurazione, per copiare effettivamente i dati nell'esperimento, fare clic con il pulsante destro del mouse sul modulo e scegliere Esegui selezionato.
Se è necessario modificare una connessione dati esistente, la procedura guidata carica tutti i dettagli di configurazione precedenti in modo che non sia necessario ricominciare da zero
Impostare manualmente le proprietà nel modulo Importa dati
La procedura seguente descrive come configurare manualmente l'origine di importazione.
Aggiungere il modulo Importa dati all'esperimento. È possibile trovare questo modulo in Studio (versione classica), nella categoria Input e output dati.
In Origine datiselezionare database SQL di Azure.
Impostare le opzioni seguenti specifiche per database SQL di Azure o Azure SQL Data Warehouse.
Nome server di database: digitare il nome del server generato da Azure. In genere è nel seguente formato:
<generated_identifier>.database.windows.net
.Nome database: digitare il nome di un database esistente nel server appena specificato.
Nome account utente server: digitare il nome utente di un account con autorizzazioni di accesso per il database.
Password dell'account utente del server: specificare la password per l'account utente specificato.
Query di database: digitare o incollare SQL istruzione che descrive i dati da leggere. Convalidare sempre SQL'istruzione e verificare i risultati della query in anticipo, usando uno strumento come Visual Studio Esplora server o SQL Server Data Tools.
Nota
Il modulo Import Data supporta solo l'immissione di nome database, nome account utente e password come credenziali.
Se il set di dati letto Machine Learning non deve cambiare tra le esecuzioni dell'esperimento, selezionare l'opzione Usa risultati memorizzati nella cache.
Quando questa opzione è selezionata, se non sono presenti altre modifiche ai parametri del modulo, l'esperimento carica i dati alla prima esecuzione del modulo e successivamente usa una versione memorizzata nella cache del set di dati.
Se si vuole ricaricare il set di dati in ogni iterazione dell'esperimento, deselezionare questa opzione. Il set di dati viene ricaricato dall'origine ogni volta che vengono modificati parametri in Importa dati.
Eseguire l'esperimento.
Quando Import Data carica i dati in Studio (versione classica), potrebbe essere eseguita anche una conversione implicita dei tipi, a seconda dei tipi di dati usati nel database di origine.
Risultati
Al termine dell'importazione, fare clic sul set di dati di output e selezionare Visualizza per verificare se i dati sono stati importati correttamente.
Facoltativamente, è possibile modificare il set di dati e i relativi metadati usando gli strumenti di Studio (versione classica):
Usare Modifica metadati per modificare i nomi delle colonne, convertire una colonna in un tipo di dati diverso o per indicare quali colonne sono etichette o caratteristiche.
Usare Seleziona colonne nel set di dati per selezionare un subset di colonne.
Usare Partition e Sample per separare il set di dati in base ai criteri o ottenere le prime n righe.
Esempio
Per un esempio di come usare i dati dei database di Azure in Machine Learning, vedere questi articoli ed esperimenti:
Retail Forecasting Step 1 of 6 - data preprocessing (Passaggio 1 di 6- pre-elaborazione dei dati): il modello di previsione retail illustra uno scenario tipico che usa i dati archiviati in Azure SQLDB per l'analisi.
Illustra anche alcune tecniche utili, ad esempio l'uso di SQLDB di Azure per il passaggio di set di dati tra esperimenti in account diversi, il salvataggio e la combinazione di previsioni e come creare un DATABASE SQL di Azure per Machine Learning.
Usare Machine Learning con SQL Data Warehouse: questo articolo illustra come creare un modello di regressione per stimare i prezzi usando Azure SQL Data Warehouse.
Come usare Azure ML con Azure SQL Data Warehouse: questo articolo compila un modello di clustering in AdventureWorks usando Importa dati ed Esporta dati con Azure SQL Data Warehouse.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Domande frequenti
È possibile filtrare i dati durante la lettura dall'origine?
Il modulo Importa dati non supporta il filtro durante la lettura dei dati. È consigliabile creare una vista o definire una query che generi solo le righe necessarie.
Nota
Se si ritiene di aver caricato più dati del necessario, è possibile sovrascrivere il set di dati memorizzato nella cache leggendo un nuovo set di dati e salvandolo con lo stesso nome del precedente set di dati più grande.
Perché viene visualizzato l'errore "Tipo decimale non supportato"?
Quando si leggono dati da un database SQL, è possibile che venga visualizzato un messaggio di errore che segnala un tipo di dati non supportato.
Se i dati che si ottengono dal database SQL includono tipi di dati non supportati in Machine Learning, è necessario eseguire il cast o convertire i decimali in dati supportati prima di leggere i dati. L'importazione di dati non può eseguire automaticamente conversioni che comportano una perdita di precisione.
Per altre informazioni sui tipi di dati supportati, vedere Tipi di dati del modulo.
Cosa accade se il database si trova in un'area geografica diversa. L'importazione dei dati può comunque accedere al database? Dove vengono archiviati i dati?
Se il database si trova in un'area diversa dall'account di Machine Learning, l'accesso ai dati potrebbe risultare più lento. Inoltre, vengono addebitati i dati in ingresso e in uscita nella sottoscrizione se il nodo di calcolo si trova in un'area diversa rispetto all'account di archiviazione.
I dati letti nell'area di lavoro per un esperimento vengono salvati nell'account di archiviazione associato all'esperimento.
Perché alcuni caratteri non vengono visualizzati correttamente?
Machine Learning supporta la codifica UTF-8. Se le colonne stringa nel database usano una codifica diversa, i caratteri potrebbero non essere importati correttamente.
Un'opzione è esportare i dati in un file CSV in Archiviazione di Azure e usare l'opzione CSV con codifica per specificare i parametri per i delimitatori personalizzati, la tabella codici e così via.
Parametri del modulo
Nome | Intervallo | Type | Predefinito | Descrizione |
---|---|---|---|---|
Origine dati | Elenco | Origine dati o sink | Archiviazione BLOB di Azure | L'origine dati può essere HTTP, FTP, HTTPS anonimo o FTPS, un file nell'archivio BLOB di Azure, una tabella di Azure, un database SQL di Azure, un database SQL Server locale, una tabella Hive o un endpoint OData. |
HDFS server URI | any | string | Nessuno | Endpoint rest HDFS |
Database server name | any | string | Nessuno | Nome dell'account di archiviazione di Azure |
Nome database | any | SecureString | Nessuno | Chiave di archiviazione di Azure |
Server user account name | any | string | Nessuno | Azure container name |
Server user account name | Elenco (subset) | Contenuto dell'URL | OData | Tipo di formato dati |
Query di database | any | string | Nessuno | Tipo di formato dati |
Usare i risultati memorizzati nella cache | VERO/FALSO | Boolean | FALSE | description |
Output
Nome | Tipo | Descrizione |
---|---|---|
Set di dati di risultati | Tabella dati | Set di dati con dati scaricati |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0027 | Viene generata un'eccezione quando due oggetti che dovrebbero essere delle stesse dimensioni sono differenti. |
Errore 0003 | Si verifica un'eccezione se uno o più input sono Null o vuoti. |
Errore 0029 | Viene generata un'eccezione quando viene passato un URI non valido. |
Errore 0030 | Viene generata un'eccezione se non è possibile scaricare un file. |
Errore 0002 | Viene generata un'eccezione se non è stato possibile analizzare o convertire uno o più parametri dal tipo specificato nel tipo richiesto dal metodo di destinazione. |
Errore 0009 | Viene generata un'eccezione se il nome dell'account di Archiviazione di Azure o il nome del contenitore non è stato specificato correttamente. |
Errore 0048 | Viene generata un'eccezione quando non è possibile aprire un file. |
Errore 0015 | Viene generata un'eccezione se la connessione al database non è riuscita. |
Errore 0046 | Viene generata un'eccezione quando non è possibile creare una directory nel percorso specificato. |
Errore 0049 | Viene generata un'eccezione quando non è possibile analizzare un file. |
Per un elenco di errori specifici dei moduli di Studio (versione classica), vedere l'Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere l'Machine Learning di errore dell'API REST.
Vedi anche
Importazione dei dati
Esportazione dei dati
Importazione da URL Web tramite HTTP
Importare da una query Hive
Importare da tabella di Azure
Importare da Archiviazione BLOB di Azure
Importare da provider di feed di dati
Importare da un database SQL Server locale