Immettere manualmente il componente Dati
Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.
Usare il componente Immetti dati manualmente per creare un set di dati di piccole dimensioni digitando i valori. Il set di dati può avere più colonne.
Questo componente può essere utile in scenari come:
- Generazione di un piccolo set di valori per il test.
- Creazione di un breve elenco di etichette.
- Digitando un elenco di nomi di colonna da inserire in un set di dati.
Creare un set di dati
Aggiungere il componente Immetti dati manualmente alla pipeline. È possibile trovare questo componente nella categoria Input e output dei dati in Azure Machine Learning.
Per DataFormat selezionare una delle opzioni seguenti. Queste opzioni determinano la modalità di analisi dei dati forniti. I requisiti per ogni formato differiscono notevolmente, quindi assicurarsi di leggere gli argomenti correlati.
- ARFF: formato di file di relazione tra attributi usato da Weka.
- CSV: formato di valori delimitati da virgole. Per altre informazioni, vedere Convertire in csv.
- SVMLight: formato usato da Vowpal Wabbit e da altri framework di Machine Learning.
- TSV: formato di valori delimitati da tabulazioni.
Se si sceglie un formato e non si forniscono dati che soddisfano le specifiche di formato, si verifica un errore di runtime.
Fare clic all'interno della casella di testo Dati per iniziare a immettere i dati. I formati seguenti richiedono particolare attenzione:
CSV: per creare più colonne, incollare testo delimitato da virgole o digitare più colonne usando virgole tra i campi.
Se si seleziona l'opzione HasHeader , è possibile usare la prima riga di valori come intestazione di colonna.
Se si deseleziona questa opzione, vengono usati i nomi delle colonne (Col1, Col2 e così via). È possibile aggiungere o modificare i nomi delle colonne in un secondo momento usando Modifica metadati.
TSV: per creare più colonne, incollare testo separato da tabulazioni o digitare più colonne usando schede tra campi.
Se si seleziona l'opzione HasHeader , è possibile usare la prima riga di valori come intestazione di colonna.
Se si deseleziona questa opzione, vengono usati i nomi delle colonne (Col1, Col2 e così via). È possibile aggiungere o modificare i nomi delle colonne in un secondo momento usando Modifica metadati.
ARFF: incollare un file di formato ARFF esistente. Se si digitano direttamente i valori, assicurarsi di aggiungere l'intestazione facoltativa e i campi dell'attributo obbligatori all'inizio dei dati.
Ad esempio, le righe di intestazione e attributo seguenti possono essere aggiunte a un elenco semplice. L'intestazione di colonna sarà
SampleText
. Si noti che il tipo String non è supportato.% Title: SampleText.ARFF % Source: Enter Data component @ATTRIBUTE SampleText NUMERIC @DATA \<type first data row here>
SVMLight: digitare o incollare i valori usando il formato SVMLight.
Ad esempio, l'esempio seguente rappresenta le prime due righe del set di dati Blood Donation, in formato SVMLight:
# features are [Recency], [Frequency], [Monetary], [Time] 1 1:2 2:50 3:12500 4:98 1 1:0 2:13 3:3250 4:28
Quando si esegue il componente Enter Data Manually , queste righe vengono convertite in un set di dati di colonne e valori di indice come indicato di seguito:
Col1 Col2 Col3 Col4 Etichette 0.00016 0,004 0.999961 0.00784 1 0 0,004 0.999955 0.008615 1
Selezionare il tasto INVIO dopo ogni riga per avviare una nuova riga.
Se si seleziona Invio più volte per aggiungere più righe finali vuote, le righe vuote verranno rimosse o tagliate.
Se si creano righe con valori mancanti, è sempre possibile filtrarle in un secondo momento.
Connettere la porta di output ad altri componenti ed eseguire la pipeline.
Per visualizzare il set di dati, fare clic con il pulsante destro del mouse sul componente e scegliere Visualizza.
Passaggi successivi
Vedere il set di componenti disponibili per Azure Machine Learning.