Conversioni tra formati di dati

Importante

Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.

A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).

La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.

Nota

Si applica a: Machine Learning Studio (versione classica)

Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.

Questo articolo elenca i moduli forniti in Machine Learning Studio (versione classica) per la conversione dei dati tra vari formati di file usati in Machine Learning.

I formati supportati includono:

  • Formato del set di dati usato in Machine Learning.
  • Formato ARFF usato da Weka. Weka è un set open source basato su Java di algoritmi di Machine Learning.
  • Formato SVMLight . Il formato SVMLight è stato sviluppato per il framework SVMlight per Machine Learning. Può essere usato anche da Vowpal Wabbit.
  • Formati di file flat delimitati da tabulazioni (TSV) e delimitati da virgole (CSV) supportati dalla maggior parte dei database relazionali. Questi formati sono ampiamente supportati anche da R e Python.

Quando si convertono i dati in questi formati, è possibile spostare più facilmente i risultati e i dati tra diversi framework di Machine Learning o meccanismi di archiviazione.

Nota

Questi moduli di conversione dati convertono solo il set di dati completo in un formato specificato. Se è necessario eseguire operazioni di cast, troncamento, conversione di formati di data-ora o altre modifiche dei valori, usare i moduli in Trasformazione dati o visualizzare l'elenco delle attività correlate.

Scenari comuni di conversione dei dati

I moduli di conversione dei dati vengono in genere utilizzati se è necessario spostare i dati da un esperimento Machine Learning a un altro strumento o piattaforma di Machine Learning. È anche possibile usare i moduli per esportare i Machine Learning in un formato che può essere usato da un database o da altri strumenti. Ad esempio:

Attività Usare
È necessario salvare un set di dati intermedio da Excel o importare in un database. Usare il modulo CSV o il modulo TSV per preparare i dati nel formato corretto. Scaricare quindi i dati o salvarli in Archiviazione di Azure.
Si vogliono riutilizzare i dati dell'esperimento nel codice R o Python. Usare il modulo CSV o il modulo TSV per preparare i dati. Fare quindi clic con il pulsante destro del mouse sul set di dati convertito per ottenere il codice Python necessario per accedere al set di dati.
Il porting dell'esperimento e dei dati tra Weka e Machine Learning. Usare il modulo ARFF per preparare i dati. Scaricare quindi i risultati.
È necessario preparare i dati nel framework SVMlight. Usare il modulo Converti in SVMLight per preparare i dati. Scaricare quindi i dati risultanti.
Creare dati da usare con Vowpal Wabbit. Usare il formato SVMLight . Modificare quindi i file come descritto nell'articolo. Salvare il file nell'archivio BLOB di Azure da usare con un modulo Vowpal Wabbit in Machine Learning.
I dati non sono in formato tabulare. Forzarlo in un formato di set di dati usando il modulo Converti in set di dati.

Se è necessario importare dati in Machine Learning o trasformare i dati in singole colonne, usare questi moduli prima di eseguire la conversione dei dati:

Attività Usare
Importare dati dal computer in Machine Learning. Upload set di dati in formato CSV, come descritto in Importare i dati di training in Machine Learning Studio (versione classica).
Importare dati da un'origine dati cloud, incluso Hadoop o Azure. Usare il modulo Importa dati.
Salvare i set di dati di Machine Learning nell'archiviazione BLOB di Azure, in un cluster Hadoop o in un'altra risorsa di archiviazione basata sul cloud. Usare il modulo Esporta dati.
Modificare il tipo di dati delle colonne o delle colonne di cast in un formato o un tipo diverso. In Machine Learning usare i moduli Modifica metadati o Applica SQL trasformazione. Se si ha esperienza con R o Python, provare i moduli Execute Python Script (Esegui script Python ) o Execute R Script (Esegui script R ).
Arrotondare, raggruppare o normalizzare i dati numerici. Usare i moduli Applica operazione matematica, Raggruppa dati in contenitori o Normalizza dati.

Elenco di moduli

La categoria Conversioni formato dati include i moduli seguenti:

  • Converti in ARFF: converte l'input di dati nel formato di file di relazione tra attributi usato dal set di strumenti Weka.
  • Converti in CSV: converte un set di dati in un formato di valori delimitati da virgole.
  • Converti in set di dati: converte l'input di dati nel formato del set di dati interno usato da Machine Learning.
  • Converti in SVMLight: converte l'input di dati nel formato usato dal framework SVMlight.
  • Converti in TSV: converte l'input di dati nel formato delimitato da tabulazioni.

Vedi anche