Transformar dados no data.world (Pré-visualização) utilizando o Azure Data Factory ou o Synapse Analytics

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Este artigo descreve como usar o Fluxo de Dados para transformar dados no data.world (Visualização). Para saber mais, leia o artigo introdutório do Azure Data Factory ou do Azure Synapse Analytics.

Importante

Este conector está atualmente em pré-visualização. Você pode experimentá-lo e nos dar feedback. Se quiser realizar uma dependência em conectores de pré-visualização na sua solução, contacte o Suporte do Azure.

Capacidades suportadas

Este conector data.world é suportado para as seguintes capacidades:

Capacidades suportadas IR
Mapeando o fluxo de dados (fonte/-) (1)

(1) Tempo de execução de integração do Azure (2) Tempo de execução de integração auto-hospedado

Para obter uma lista de armazenamentos de dados suportados como fontes/coletores, consulte a tabela Armazenamentos de dados suportados.

Criar um data.world serviço vinculado usando a interface do usuário

Use as etapas a seguir para criar um data.world serviço vinculado na interface do usuário do portal do Azure.

  1. Navegue até a guia Gerenciar em seu espaço de trabalho do Azure Data Factory ou Synapse e selecione Serviços Vinculados e, em seguida, selecione Novo:

  2. Procure data.world (Pré-visualização) e selecione o conector data.world (Pré-visualização).

    Captura de tela mostrando a seleção data.world conector.

  3. Configure os detalhes do serviço, teste a conexão e crie o novo serviço vinculado.

    Captura de tela da configuração de data.world serviço vinculado.

Detalhes de configuração do conector

As seções a seguir fornecem informações sobre propriedades usadas para definir entidades de pipeline do Data Factory e do Synapse específicas para data.world.

Propriedades do serviço vinculado

As seguintes propriedades são suportadas para o data.world serviço vinculado:

Property Descrição Obrigatório
tipo A propriedade type deve ser definida como Dataworld. Sim
apiToken Especifique um token de API para o data.world. Marque este campo como SecureString para armazená-lo com segurança. Ou, você pode fazer referência a um segredo armazenado no Cofre da Chave do Azure. Sim

Exemplo:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Mapeando propriedades de fluxo de dados

Ao transformar dados em mapeamento de fluxo de dados, você pode ler tabelas de data.world. Para obter mais informações, consulte a transformação de origem no mapeamento de fluxos de dados. Você só pode usar um conjunto de dados embutido como tipo de origem.

Transformação da fonte

A tabela abaixo lista as propriedades suportadas por data.world origem. Você pode editar essas propriedades na guia Opções de origem .

Nome Descrição Obrigatório Valores permitidos Propriedade do script de fluxo de dados
Nome do conjunto de dados A ID do conjunto de dados em data.world. Sim String datasetId
Nome da tabela A ID da tabela dentro do conjunto de dados em data.world. Não (se query for especificado) String tableId
Query Insira uma consulta SQL para buscar dados de data.world. Um exemplo é select * from MyTable. Não (se tableId for especificado) String query
Proprietário O proprietário do conjunto de dados em data.world. Sim String proprietário

data.world exemplo de script de origem

Quando você usa data.world como tipo de origem, o script de fluxo de dados associado é:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Para obter uma lista de armazenamentos de dados suportados como fontes e coletores pela atividade de cópia, consulte Armazenamentos de dados suportados.