Como usar blocos de anotações do Microsoft Fabric

O notebook Microsoft Fabric é um item de código primário para o desenvolvimento de trabalhos do Apache Spark e experimentos de aprendizado de máquina. É uma superfície interativa baseada na Web usada por cientistas de dados e engenheiros de dados para escrever código, beneficiando-se de visualizações ricas e texto Markdown. Os engenheiros de dados escrevem código para ingestão de dados, preparação de dados e transformação de dados. Os cientistas de dados também usam notebooks para criar soluções de aprendizado de máquina, incluindo a criação de experimentos e modelos, rastreamento de modelos e implantação.

Com um notebook Fabric, você pode:

  • Comece com zero esforço de configuração.
  • Explore e processe dados facilmente com uma experiência intuitiva de baixo código.
  • Mantenha os dados seguros com funcionalidades de segurança empresariais integradas.
  • Analise dados em formatos brutos (CSV, txt, JSON, etc.), formatos de arquivo processados (parquet, Delta Lake, etc.), usando recursos poderosos do Spark.
  • Seja produtivo com recursos de criação aprimorados e visualização de dados integrada.

Este artigo descreve como usar blocos de anotações em experiências de ciência de dados e engenharia de dados.

Contexto de segurança do bloco de notas em execução

A execução de um notebook pode ser acionada por três maneiras diferentes no Fabric com total flexibilidade para atender a diferentes cenários:

  • Execução interativa: o usuário aciona manualmente a execução por meio das diferentes entradas UX ou chamando a API REST. A execução seria executada sob o contexto de segurança do usuário atual.
  • Executar como atividade de pipeline: a execução é acionada a partir do pipeline do Fabric Data Factory. Você pode encontrar as etapas detalhadas na Atividade do Bloco de Anotações. A execução estaria sendo executada sob o contexto de segurança do proprietário do gasoduto.
  • Agendador: A execução é acionada a partir de um plano do agendador. A execução seria executada sob o contexto de segurança do usuário que configura/atualiza o plano do agendador.

A flexibilidade dessas opções de execução com diferentes contextos de segurança permite que você atenda a diferentes cenários e requisitos, mas também exige que você esteja ciente do contexto de segurança ao projetar e desenvolver seu notebook, caso contrário, pode causar um comportamento inesperado e até mesmo alguns problemas de segurança.

Na primeira vez que um bloco de anotações é criado, uma mensagem de aviso será mostrada para lembrá-lo do risco de executar o código sem revisá-lo.

Captura de tela mostrando o aviso de execução do bloco de anotações.

Aqui estão algumas práticas recomendadas para ajudá-lo a evitar problemas de segurança:

  • Antes de executar manualmente o bloco de anotações, abra a configuração Bloco de anotações e verifique a seção Detalhes no painel Sobre para obter a atualização da modificação, verifique se você está bem com a alteração mais recente.
  • Antes de adicionar uma atividade de bloco de anotações a um pipeline, abra a configuração Bloco de anotações e verifique a seção Detalhes no painel Sobre para obter a atualização de modificação, verifique se você está de acordo com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Bloco de Anotações para revisar a alteração antes de adicioná-la ao pipeline.
  • Antes de atualizar o plano do agendador, abra a configuração do Bloco de Anotações e verifique a seção Detalhes no painel Sobre para obter a atualização da modificação, verifique se você está bem com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Bloco de Anotações para revisar a alteração antes de atualizar o plano do agendador.
  • Separe o espaço de trabalho em diferentes estágios (desenvolvimento, teste, prod) e controle o acesso de diferentes estágios para evitar o problema de segurança. Adicione apenas o usuário em quem você confia ao estágio prod.

Criar blocos de notas

Você pode criar um novo bloco de anotações ou importar um bloco de anotações existente.

Criar um novo Notebook

Como outros processos padrão de criação de itens de malha, você pode criar facilmente um novo bloco de anotações na página inicial do Fabric Data Engineering, na opção Novo espaço de trabalho ou no Create Hub.

Importar blocos de notas existentes

Você pode importar um ou mais blocos de anotações existentes do computador local usando a entrada na barra de ferramentas do espaço de trabalho. Os blocos de anotações de malha reconhecem os arquivos .ipynb padrão do Jupyter Notebook e os arquivos de origem, como .py, .scala e .sql, e criam novos itens de bloco de anotações de acordo.

Captura de ecrã a mostrar onde encontrar as opções do bloco de notas no menu Novo.

Exportar um bloco de notas

Pode exportar o seu bloco de notas para outros formatos padrão. O notebook Synapse pode ser exportado para:

  • O arquivo de bloco de anotações padrão (.ipynb) usado para blocos de anotações Jupyter.
  • Um ficheiro HTML (.html) que pode ser aberto diretamente a partir de um navegador.
  • Um arquivo Python (.py).
  • Um ficheiro Latex (.tex).

Captura de ecrã a mostrar para onde exportar o bloco de notas.

Guardar um bloco de notas

No Fabric, por padrão, um bloco de anotações salva automaticamente depois que você o abre e edita; Você não precisa se preocupar em perder alterações de código. Você também pode usar Salvar uma cópia para clonar outra cópia no espaço de trabalho atual ou para outro espaço de trabalho.

Captura de ecrã a mostrar onde guardar uma cópia.

Se preferir guardar um bloco de notas manualmente, pode mudar para a opção Guardar manual para ter uma ramificação local do item do seu bloco de notas e, em seguida, utilizar Guardar ou CTRL+s para guardar as alterações.

Captura de ecrã a mostrar onde mudar a gravação manual.

Você também pode alternar para o modo de salvamento manual selecionando Editar ->Salvar opções ->Manual. Para ativar uma ramificação local do seu bloco de notas e, em seguida, guardá-la manualmente, selecione Guardar ou utilize o atalho de teclado Ctrl+s .

Conecte casas de lago e notebooks

Os cadernos de tecido agora suportam interações próximas com lagos; você pode facilmente adicionar uma casa de lago nova ou existente do explorador Lakehouse.

Você pode navegar para diferentes lakehouses no Lakehouse explorer e definir uma lakehouse como padrão, fixando-a. Seu padrão é então montado no diretório de trabalho do tempo de execução, e você pode ler ou gravar no lakehouse padrão usando um caminho local.

Captura de tela mostrando onde fixar uma casa de lago padrão.

Nota

Você deve reiniciar a sessão depois de fixar uma nova lakehouse ou renomear a lakehouse padrão.

Adicionar ou remover uma casa no lago

Selecionar o ícone X ao lado do nome de uma casa de lago o remove da guia do bloco de anotações, mas o item de casa de lago ainda existe no espaço de trabalho.

Selecione Adicionar lakehouse para adicionar mais lakehouses ao bloco de anotações, adicionando uma existente ou criando uma nova lakehouse.

Explore um arquivo lakehouse

A subpasta e os arquivos na seção Tabelas e Arquivos da visualização Lago aparecem em uma área de conteúdo entre a lista lakehouse e o conteúdo do bloco de anotações. Selecione pastas diferentes na seção Tabelas e Arquivos para atualizar a área de conteúdo.

Operações de pastas e arquivos

Se você selecionar um arquivo (.csv, .parquet, .txt, .jpg, .png, etc.) com um clique direito do mouse, você pode usar a API Spark ou Pandas para carregar os dados. Uma nova célula de código é gerada e inserida abaixo da célula de foco.

Você pode facilmente copiar um caminho com um formato diferente do arquivo ou pasta de seleção e usar o caminho correspondente em seu código.

Captura de tela mostrando o menu de contexto de arquivos em lakehouse.

Recursos do bloco de notas

O explorador de recursos do notebook fornece um sistema de arquivos semelhante ao Unix para ajudá-lo a gerenciar suas pastas e arquivos. Ele oferece um espaço de sistema de arquivos gravável onde você pode armazenar arquivos de pequeno porte, como módulos de código, modelos semânticos e imagens. Você pode acessá-los facilmente com código no bloco de anotações como se estivesse trabalhando com seu sistema de arquivos local.

GIF animado de recursos do bloco de anotações.

Nota

  • O armazenamento máximo de recursos para pasta interna e pasta de ambiente é de 500 MB, com um único tamanho de arquivo de até 100 MB. Ambos permitem até 100 instâncias de arquivo/pasta no total.
  • Ao usar notebookutils.notebook.run()o , use o notebookutils.nbResPath comando para acessar o recurso do bloco de anotações de destino. O caminho relativo builtin/ sempre apontará para a pasta interna do bloco de anotações raiz.

Pasta de recursos integrada

A pasta de recursos interna é uma pasta predefinida do sistema para cada instância de item do bloco de anotações. Aqui estão os principais recursos para os recursos do bloco de anotações.

  • Você pode usar operações comuns, como criar/excluir, carregar/baixar, arrastar/soltar, renomear, duplicar e pesquisar na interface do usuário.
  • Você pode usar caminhos relativos, como builtin/YourData.txt para exploração rápida. O notebookutils.nbResPath método ajuda você a compor o caminho completo.
  • Você pode facilmente mover seus dados validados para uma casa de lago através da opção Gravar em lakehouse . O Fabric incorporou rich code snippets para tipos de arquivo comuns para ajudá-lo a começar rapidamente.
  • Esses recursos também estão disponíveis para uso no caso de execução do bloco de anotações de referência via notebookutils.notebook.run().

Pasta de recursos de ambiente

A Pasta de Recursos do Ambiente é um repositório compartilhado projetado para simplificar a colaboração em vários blocos de anotações.

  • Você pode encontrar a guia Recursos dentro do ambiente e ter as operações completas para gerenciar os arquivos de recursos aqui. Esses arquivos podem ser compartilhados em vários blocos de anotações depois que o bloco de anotações é anexado ao ambiente atual.

    Captura de tela mostrando onde gerenciar recursos no ambiente.

  • Na página Bloco de Anotações, você pode encontrar facilmente uma segunda pasta raiz em Recursos herdados do ambiente anexado.

    Captura de tela mostrando onde abrir a pasta de recursos do ambiente.

  • Você também pode operar nos arquivos / pastas da mesma forma com a pasta de recursos internos.

  • O caminho do recurso Ambiente será montado automaticamente no cluster de notebooks, você pode usar o caminho relativo /env para acessar os recursos do ambiente.

Editor de ficheiros

O editor de arquivos permite que você visualize e edite arquivos diretamente na pasta de recursos do bloco de anotações e na pasta de recursos do ambiente no bloco de anotações. Os tipos de ficheiro suportados incluem CSV, TXT, HTML, YML, PY, SQL e muito mais. Com o editor de arquivos, você pode facilmente acessar e modificar arquivos dentro do bloco de anotações, ele suporta realce de palavra-chave e fornece o serviço de idioma necessário ao abrir e editar arquivos de código, como .py e .sql.

  • Pode aceder a esta funcionalidade através de 'Ver e editar' no menu de ficheiros. Clique duas vezes no arquivo é uma maneira mais rápida.

    Captura de ecrã a mostrar onde ver e editar ficheiros.

  • A alteração de conteúdo no editor de arquivos precisa ser salva manualmente clicando no botão Salvar ou no atalho de teclado: Ctrl+S, o editor de arquivos não suporta o salvamento automático.

  • O editor de arquivos também é afetado pelo modo de bloco de anotações. Só pode ver ficheiros, mas não pode editá-los se estiver no modo de bloco de notas sem permissão de edição.

Nota

Aqui estão algumas limitações para o editor de arquivos.

  • O limite de tamanho do ficheiro é de 1 MB.
  • Estes tipos de ficheiro não são suportados para visualização e edição: .xlsx e .parquet.

Colaborar num bloco de notas

O bloco de anotações Fabric é um item colaborativo que suporta vários usuários editando o mesmo bloco de anotações.

Quando abre um bloco de notas, entra no modo de coedição por predefinição e todas as edições do bloco de notas são guardadas automaticamente. Se seus colegas abrirem o mesmo bloco de anotações ao mesmo tempo, você verá o perfil, a saída da execução, o indicador do cursor, o indicador de seleção e o rastreamento de edição. Usando os recursos de colaboração, você pode facilmente realizar programação em pares, depuração remota e cenários de tutoria.

Captura de ecrã a mostrar uma célula de código com outro utilizador a editar.

Partilhar um bloco de notas

Partilhar um bloco de notas é uma forma conveniente de colaborar com os membros da equipa. As funções de espaço de trabalho autorizadas podem exibir ou editar/executar blocos de anotações por padrão. Você pode compartilhar um bloco de anotações com as permissões especificadas concedidas.

  1. Selecione Compartilhar na barra de ferramentas do bloco de anotações.

    Captura de ecrã a mostrar onde selecionar Partilhar.

  2. Selecione a categoria correspondente de pessoas que podem ver este bloco de notas. Você pode escolher as permissões Compartilhar, Editar ou Executar para os destinatários.

    Captura de tela mostrando onde selecionar permissões.

  3. Depois de selecionar Aplicar, você pode enviar o bloco de anotações diretamente ou copiar o link para outras pessoas. Os destinatários podem então abrir o bloco de notas com a vista correspondente concedida pelo seu nível de permissão.

    Captura de tela mostrando onde criar e enviar link.

  4. Para gerir ainda mais as permissões do seu bloco de notas, selecione Lista de itens>da área de trabalho Mais opções e, em seguida, selecione Gerir permissões. Nessa tela, você pode atualizar o acesso e as permissões existentes do bloco de anotações.

    Captura de tela mostrando onde gerenciar permissões no espaço de trabalho.

Comentar uma célula de código

Comentar é outro recurso útil para cenários colaborativos. Atualmente, o Fabric oferece suporte à adição de comentários no nível da célula.

  1. Selecione o botão Comentários na barra de ferramentas do bloco de anotações ou no indicador de comentário da célula para abrir o painel Comentários .

    Captura de ecrã a mostrar onde selecionar Comentário.

  2. Selecione o código na célula de código, selecione Novo no painel Comentários , adicione comentários e, em seguida, selecione Publicar comentário para salvar.

    Captura de tela mostrando onde selecionar Novo.

  3. Se precisar deles, encontre as opções Editar comentário, Resolver thread e Excluir thread selecionando a opção Mais ao lado do seu comentário.

Marcar outras pessoas num comentário

"Marcação" refere-se a mencionar e notificar um usuário em um thread de comentários, aprimorando a colaboração de forma eficiente nos detalhes.

  1. Selecione uma seção de código em uma célula e um novo thread de comentários.

  2. Insira o nome de usuário e escolha o correto na lista de sugestões se quiser mencionar alguém para discussão sobre uma determinada seção.

  3. Partilhe as suas ideias e publique-as .

  4. Uma notificação por e-mail será acionada e o usuário clicará no link Abrir comentários para localizar rapidamente essa célula.

  5. Além disso, autorize e configure as permissões para usuários ao marcar alguém que não tem acesso, garantindo que seus ativos de código sejam bem gerenciados.

GIF animado de marcar outras pessoas em um comentário.

Nota

Para um item de comentário, o usuário marcado não receberá mais uma notificação por e-mail se você atualizar o comentário dentro de uma hora. Mas ele enviará uma notificação por e-mail para o novo usuário marcado.

Comutador de modo de notebook

Os notebooks de malha suportam quatro modos que você pode alternar facilmente: modo de desenvolvimento , modo de execução apenas , modo de edição e modo de visualização . Cada modo mapeia para uma combinação de permissões específica. Ao compartilhar o bloco de anotações com outros membros da equipe, você pode conceder permissões adequadas aos destinatários, e eles verão o melhor modo de bloco de anotações disponível de acordo com sua permissão, e poderão alternar entre o modo para o qual têm permissão.

Captura de ecrã a mostrar onde muda os modos.

  • Modo de desenvolvimento: permissão de leitura, execução e gravação necessária.
  • Modo Executar somente: Ler, executar a permissão necessária.
  • Modo de edição: permissão de leitura, gravação necessária.
  • Modo de visualização: permissão de Ler necessário.