Trasformare i dati in data.world (anteprima) usando Azure Data Factory o Synapse Analytics

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi all-in-one per le aziende. Microsoft Fabric copre tutto, dallo spostamento dati al data science, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Vedere le informazioni su come iniziare una nuova prova gratuita!

Questo articolo illustra come usare il flusso di dati per trasformare i dati in data.world (anteprima). Per altre informazioni, leggere l'articolo introduttivo per Azure Data Factory o Azure Synapse Analytics.

Importante

Questo connettore è attualmente disponibile in anteprima. È possibile provarlo e inviare commenti e suggerimenti. Se si vuole accettare una dipendenza dai connettori in versione di anteprima nella propria soluzione, contattare il supporto tecnico di Azure.

Funzionalità supportate

Questo connettore data.world è supportato per le funzionalità seguenti:

Funzionalità supportate IR
Flusso di dati per mapping (origine/-)

① Azure Integration Runtime ② Runtime di integrazione self-hosted

Per un elenco degli archivi dati supportati come origini o sink, vedere la tabella Archivi dati supportati.

Creare un servizio collegato data.world usando l'interfaccia utente

Usare la procedura seguente per creare un servizio collegato data.world nell'interfaccia utente del portale di Azure.

  1. Passare alla scheda Gestisci nell'area di lavoro di Azure Data Factory o Synapse e selezionare Servizi collegati, quindi selezionare Nuovo:

  2. Cercare data.world (anteprima) e selezionare il connettore data.world (anteprima).

    Screenshot che mostra la selezione del connettore data.world.

  3. Configurare i dettagli del servizio, testare la connessione e creare il nuovo servizio collegato.

    Screenshot della configurazione per il servizio collegato data.world.

Dettagli di configurazione del connettore

Le sezioni seguenti forniscono informazioni sulle proprietà usate per definire entità della pipeline di Data Factory e Synapse specifiche per data.world.

Proprietà del servizio collegato

Per il servizio collegato data.world sono supportate le proprietà seguenti:

Proprietà Descrizione Richiesto
type La proprietà tipo deve essere impostata su Dataworld.
apiToken Specificare un token API per il data.world. Contrassegnare questo campo come SecureString per archiviarlo in modo sicuro. In alternativa, fare riferimento a un segreto archiviato in Azure Key Vault.

Esempio:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Proprietà del flusso di dati per mapping

Quando si trasformano i dati nel flusso di dati di mapping, è possibile leggere le tabelle da data.world. Per altre informazioni, vedere la trasformazione origine nei flussi di dati per mapping. È possibile usare solo un set di dati inline come tipo di origine.

Trasformazione origine

Nella tabella seguente sono elencate le proprietà supportate dall’origine data.world. È possibile modificare queste proprietà nella scheda Opzioni origine.

Nome Descrizione Richiesto Valori consentiti Proprietà script del flusso di dati
Nome del set di dati ID del set di dati in data.world. String datasetId
Nome tabella ID della tabella all'interno del set di dati in data.world. No (se viene specificato query) String tableId
Query Immettere una query SQL per recuperare i dati da data.world. Un esempio è select * from MyTable. No (se viene specificato tableId) String query
Proprietario Proprietario del set di dati in data.world. String owner

Esempio di script di origine data.world

Quando si usa data.world come tipo di origine, lo script del flusso di dati associato è:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Per un elenco degli archivi dati supportati come origini e sink dall'attività di copia, vedere Archivi dati supportati.