Conversioni tra formati di dati
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Questo articolo elenca i moduli forniti in Machine Learning Studio (versione classica) per la conversione dei dati tra vari formati di file usati in Machine Learning.
I formati supportati includono:
- Formato del set di dati usato in Machine Learning.
- Formato ARFF usato da Weka. Weka è un set open source basato su Java di algoritmi di Machine Learning.
- Formato SVMLight . Il formato SVMLight è stato sviluppato per il framework SVMlight per Machine Learning. Può essere usato anche da Vowpal Wabbit.
- Formati di file flat delimitati da tabulazioni (TSV) e delimitati da virgole (CSV) supportati dalla maggior parte dei database relazionali. Questi formati sono ampiamente supportati anche da R e Python.
Quando si convertono i dati in questi formati, è possibile spostare più facilmente i risultati e i dati tra diversi framework di Machine Learning o meccanismi di archiviazione.
Nota
Questi moduli di conversione dati convertono solo il set di dati completo in un formato specificato. Se è necessario eseguire operazioni di cast, troncamento, conversione di formati di data-ora o altre modifiche dei valori, usare i moduli in Trasformazione dati o visualizzare l'elenco delle attività correlate.
Scenari comuni di conversione dei dati
I moduli di conversione dei dati vengono in genere utilizzati se è necessario spostare i dati da un esperimento Machine Learning a un altro strumento o piattaforma di Machine Learning. È anche possibile usare i moduli per esportare i Machine Learning in un formato che può essere usato da un database o da altri strumenti. Ad esempio:
Attività | Usare |
---|---|
È necessario salvare un set di dati intermedio da Excel o importare in un database. | Usare il modulo CSV o il modulo TSV per preparare i dati nel formato corretto. Scaricare quindi i dati o salvarli in Archiviazione di Azure. |
Si vogliono riutilizzare i dati dell'esperimento nel codice R o Python. | Usare il modulo CSV o il modulo TSV per preparare i dati. Fare quindi clic con il pulsante destro del mouse sul set di dati convertito per ottenere il codice Python necessario per accedere al set di dati. |
Il porting dell'esperimento e dei dati tra Weka e Machine Learning. | Usare il modulo ARFF per preparare i dati. Scaricare quindi i risultati. |
È necessario preparare i dati nel framework SVMlight. | Usare il modulo Converti in SVMLight per preparare i dati. Scaricare quindi i dati risultanti. |
Creare dati da usare con Vowpal Wabbit. | Usare il formato SVMLight . Modificare quindi i file come descritto nell'articolo. Salvare il file nell'archivio BLOB di Azure da usare con un modulo Vowpal Wabbit in Machine Learning. |
I dati non sono in formato tabulare. | Forzarlo in un formato di set di dati usando il modulo Converti in set di dati. |
Attività correlate
Se è necessario importare dati in Machine Learning o trasformare i dati in singole colonne, usare questi moduli prima di eseguire la conversione dei dati:
Attività | Usare |
---|---|
Importare dati dal computer in Machine Learning. | Upload set di dati in formato CSV, come descritto in Importare i dati di training in Machine Learning Studio (versione classica). |
Importare dati da un'origine dati cloud, incluso Hadoop o Azure. | Usare il modulo Importa dati. |
Salvare i set di dati di Machine Learning nell'archiviazione BLOB di Azure, in un cluster Hadoop o in un'altra risorsa di archiviazione basata sul cloud. | Usare il modulo Esporta dati. |
Modificare il tipo di dati delle colonne o delle colonne di cast in un formato o un tipo diverso. | In Machine Learning usare i moduli Modifica metadati o Applica SQL trasformazione. Se si ha esperienza con R o Python, provare i moduli Execute Python Script (Esegui script Python ) o Execute R Script (Esegui script R ). |
Arrotondare, raggruppare o normalizzare i dati numerici. | Usare i moduli Applica operazione matematica, Raggruppa dati in contenitori o Normalizza dati. |
Elenco di moduli
La categoria Conversioni formato dati include i moduli seguenti:
- Converti in ARFF: converte l'input di dati nel formato di file di relazione tra attributi usato dal set di strumenti Weka.
- Converti in CSV: converte un set di dati in un formato di valori delimitati da virgole.
- Converti in set di dati: converte l'input di dati nel formato del set di dati interno usato da Machine Learning.
- Converti in SVMLight: converte l'input di dati nel formato usato dal framework SVMlight.
- Converti in TSV: converte l'input di dati nel formato delimitato da tabulazioni.