Transformar dados executando um notebook do Synapse

A atividade Notebook no pipeline permite que você execute o Notebook criado no Microsoft Fabric. Você pode criar uma atividade do Notebook diretamente por meio da interface do usuário do Fabric. Este artigo fornece um passo a passo que descreve como criar uma atividade de Notebook usando a interface do usuário do Data Factory.

Adicionar uma atividade de Notebook a um pipeline

Essa seção descreve como usar uma atividade do Notebook em um pipeline.

Pré-requisitos

Para começar, você deve concluir os seguintes pré-requisitos:

Criando a atividade

  1. Crie um pipeline no seu workspace.

  2. Procure por Notebook no painel Atividades do pipeline e arraste uma atividade de Pesquisa para a tela do pipeline.

    Captura de tela da interface do usuário do Fabric com o painel Atividades e a atividade do Notebook realçada.

  3. Selecione a nova atividade Notebook na tela se ela ainda não estiver selecionada.

    Captura de tela mostrando a guia Configurações gerais da atividade do Notebook.

Consulte as diretrizes de Configurações Geraispara definir a guia Configurações Gerais.

Configurações do notebook

Selecione a guia Configurações , selecione um notebook existente na lista suspensa Notebook e, opcionalmente, especifique todos os parâmetros a serem passados para o notebook.

Captura de tela mostrando a guia Configurações gerais da atividade Notebook. Captura de tela mostrando a guia Configurações do notebook destacando a guia, onde escolher um notebook e onde adicionar parâmetros.

Tag de sessão

Para minimizar o tempo necessário para executar o trabalho do notebook, você pode, opcionalmente, definir uma tag de sessão. Definir a tag de sessão instruirá o Spark a reutilizar qualquer sessão existente do Spark, minimizando assim o tempo de inicialização. Qualquer valor de string arbitrário pode ser usado para a tag de sessão. Se não houver sessão, uma nova será criada usando o valor da tag.

Captura de tela mostrando a guia Configurações do Notebook destacando a guia, onde adicionar a tag de sessão.

Observação

Para poder usar a tag de sessão, a opção Modo de alta simultaneidade para pipeline que executa vários notebooks deve estar ativada. Essa opção pode ser encontrada no modo de alta simultaneidade para configurações do Spark nas configurações do Workspace

Captura de tela mostrando a guia Configurações do workspace destacando a guia, onde habilitar o modo de alta simultaneidade para pipelines que executam vários notebooks.

Salvar e executar ou agendar o pipeline

Alterne para a guia Página Inicial na parte superior do editor de pipeline e selecione o botão Salvar para salvar o pipeline. Selecione Executar para executá-lo diretamente ou Agendar para agendá-lo. Você também pode exibir o histórico de execuções aqui ou definir outras configurações.

Captura de tela mostrando a guia Início no editor de pipeline com o nome da guia e os botões Salvar, Executar e Agendar realçados.