Como usar blocos de anotações do Microsoft Fabric
O notebook Microsoft Fabric é um item de código primário para o desenvolvimento de trabalhos do Apache Spark e experimentos de aprendizado de máquina. É uma superfície interativa baseada na Web usada por cientistas de dados e engenheiros de dados para escrever código, beneficiando-se de visualizações ricas e texto Markdown. Os engenheiros de dados escrevem código para ingestão de dados, preparação de dados e transformação de dados. Os cientistas de dados também usam notebooks para criar soluções de aprendizado de máquina, incluindo a criação de experimentos e modelos, rastreamento de modelos e implantação.
Com um notebook Fabric, você pode:
- Comece com zero esforço de configuração.
- Explore e processe dados facilmente com uma experiência intuitiva de baixo código.
- Mantenha os dados seguros com funcionalidades de segurança empresariais integradas.
- Analise dados em formatos brutos (CSV, txt, JSON, etc.), formatos de arquivo processados (parquet, Delta Lake, etc.), usando recursos poderosos do Spark.
- Seja produtivo com recursos de criação aprimorados e visualização de dados integrada.
Este artigo descreve como usar blocos de anotações em experiências de ciência de dados e engenharia de dados.
Contexto de segurança do bloco de notas em execução
A execução de um notebook pode ser acionada por três maneiras diferentes no Fabric com total flexibilidade para atender a diferentes cenários:
- Execução interativa: o usuário aciona manualmente a execução por meio das diferentes entradas UX ou chamando a API REST. A execução seria executada sob o contexto de segurança do usuário atual.
- Executar como atividade de pipeline: a execução é acionada a partir do pipeline do Fabric Data Factory. Você pode encontrar as etapas detalhadas na Atividade do Bloco de Anotações. A execução estaria sendo executada sob o contexto de segurança do proprietário do gasoduto.
- Agendador: A execução é acionada a partir de um plano do agendador. A execução seria executada sob o contexto de segurança do usuário que configura/atualiza o plano do agendador.
A flexibilidade dessas opções de execução com diferentes contextos de segurança permite que você atenda a diferentes cenários e requisitos, mas também exige que você esteja ciente do contexto de segurança ao projetar e desenvolver seu notebook, caso contrário, pode causar um comportamento inesperado e até mesmo alguns problemas de segurança.
Na primeira vez que um bloco de anotações é criado, uma mensagem de aviso será mostrada para lembrá-lo do risco de executar o código sem revisá-lo.
Aqui estão algumas práticas recomendadas para ajudá-lo a evitar problemas de segurança:
- Antes de executar manualmente o bloco de anotações, abra a configuração Bloco de anotações e verifique a seção Detalhes no painel Sobre para obter a atualização da modificação, verifique se você está bem com a alteração mais recente.
- Antes de adicionar uma atividade de bloco de anotações a um pipeline, abra a configuração Bloco de anotações e verifique a seção Detalhes no painel Sobre para obter a atualização de modificação, verifique se você está de acordo com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Bloco de Anotações para revisar a alteração antes de adicioná-la ao pipeline.
- Antes de atualizar o plano do agendador, abra a configuração do Bloco de Anotações e verifique a seção Detalhes no painel Sobre para obter a atualização da modificação, verifique se você está bem com a alteração mais recente. Se você não tiver certeza sobre a alteração mais recente, é melhor abrir o Bloco de Anotações para revisar a alteração antes de atualizar o plano do agendador.
- Separe o espaço de trabalho em diferentes estágios (desenvolvimento, teste, prod) e controle o acesso de diferentes estágios para evitar o problema de segurança. Adicione apenas o usuário em quem você confia ao estágio prod.
Criar blocos de notas
Você pode criar um novo bloco de anotações ou importar um bloco de anotações existente.
Criar um novo Notebook
Como outros processos padrão de criação de itens de malha, você pode criar facilmente um novo bloco de anotações na página inicial do Fabric Data Engineering, na opção Novo espaço de trabalho ou no Create Hub.
Importar blocos de notas existentes
Você pode importar um ou mais blocos de anotações existentes do computador local usando a entrada na barra de ferramentas do espaço de trabalho. Os blocos de anotações de malha reconhecem os arquivos .ipynb padrão do Jupyter Notebook e os arquivos de origem, como .py, .scala e .sql, e criam novos itens de bloco de anotações de acordo.
Exportar um bloco de notas
Pode exportar o seu bloco de notas para outros formatos padrão. O notebook Synapse pode ser exportado para:
- O arquivo de bloco de anotações padrão (.ipynb) usado para blocos de anotações Jupyter.
- Um ficheiro HTML (.html) que pode ser aberto diretamente a partir de um navegador.
- Um arquivo Python (.py).
- Um ficheiro Latex (.tex).
Guardar um bloco de notas
No Fabric, por padrão, um bloco de anotações salva automaticamente depois que você o abre e edita; Você não precisa se preocupar em perder alterações de código. Você também pode usar Salvar uma cópia para clonar outra cópia no espaço de trabalho atual ou para outro espaço de trabalho.
Se preferir guardar um bloco de notas manualmente, pode mudar para a opção Guardar manual para ter uma ramificação local do item do seu bloco de notas e, em seguida, utilizar Guardar ou CTRL+s para guardar as alterações.
Você também pode alternar para o modo de salvamento manual selecionando Editar ->Salvar opções ->Manual. Para ativar uma ramificação local do seu bloco de notas e, em seguida, guardá-la manualmente, selecione Guardar ou utilize o atalho de teclado Ctrl+s .
Conecte casas de lago e notebooks
Os cadernos de tecido agora suportam interações próximas com lagos; você pode facilmente adicionar uma casa de lago nova ou existente do explorador Lakehouse.
Você pode navegar para diferentes lakehouses no Lakehouse explorer e definir uma lakehouse como padrão, fixando-a. Seu padrão é então montado no diretório de trabalho do tempo de execução, e você pode ler ou gravar no lakehouse padrão usando um caminho local.
Nota
Você deve reiniciar a sessão depois de fixar uma nova lakehouse ou renomear a lakehouse padrão.
Adicionar ou remover uma casa no lago
Selecionar o ícone X ao lado do nome de uma casa de lago o remove da guia do bloco de anotações, mas o item de casa de lago ainda existe no espaço de trabalho.
Selecione Adicionar lakehouse para adicionar mais lakehouses ao bloco de anotações, adicionando uma existente ou criando uma nova lakehouse.
Explore um arquivo lakehouse
A subpasta e os arquivos na seção Tabelas e Arquivos da visualização Lago aparecem em uma área de conteúdo entre a lista lakehouse e o conteúdo do bloco de anotações. Selecione pastas diferentes na seção Tabelas e Arquivos para atualizar a área de conteúdo.
Operações de pastas e arquivos
Se você selecionar um arquivo (.csv, .parquet, .txt, .jpg, .png, etc.) com um clique direito do mouse, você pode usar a API Spark ou Pandas para carregar os dados. Uma nova célula de código é gerada e inserida abaixo da célula de foco.
Você pode facilmente copiar um caminho com um formato diferente do arquivo ou pasta de seleção e usar o caminho correspondente em seu código.
Recursos do bloco de notas
O explorador de recursos do notebook fornece um sistema de arquivos semelhante ao Unix para ajudá-lo a gerenciar suas pastas e arquivos. Ele oferece um espaço de sistema de arquivos gravável onde você pode armazenar arquivos de pequeno porte, como módulos de código, modelos semânticos e imagens. Você pode acessá-los facilmente com código no bloco de anotações como se estivesse trabalhando com seu sistema de arquivos local.
Nota
- O armazenamento máximo de recursos para pasta interna e pasta de ambiente é de 500 MB, com um único tamanho de arquivo de até 100 MB. Ambos permitem até 100 instâncias de arquivo/pasta no total.
- Ao usar
notebookutils.notebook.run()
o , use onotebookutils.nbResPath
comando para acessar o recurso do bloco de anotações de destino. O caminho relativo builtin/ sempre apontará para a pasta interna do bloco de anotações raiz.
Pasta de recursos integrada
A pasta de recursos interna é uma pasta predefinida do sistema para cada instância de item do bloco de anotações. Aqui estão os principais recursos para os recursos do bloco de anotações.
- Você pode usar operações comuns, como criar/excluir, carregar/baixar, arrastar/soltar, renomear, duplicar e pesquisar na interface do usuário.
- Você pode usar caminhos relativos, como
builtin/YourData.txt
para exploração rápida. Onotebookutils.nbResPath
método ajuda você a compor o caminho completo. - Você pode facilmente mover seus dados validados para uma casa de lago através da opção Gravar em lakehouse . O Fabric incorporou rich code snippets para tipos de arquivo comuns para ajudá-lo a começar rapidamente.
- Esses recursos também estão disponíveis para uso no caso de execução do bloco de anotações de referência via
notebookutils.notebook.run()
.
Pasta de recursos de ambiente
A Pasta de Recursos do Ambiente é um repositório compartilhado projetado para simplificar a colaboração em vários blocos de anotações.
Você pode encontrar a guia Recursos dentro do ambiente e ter as operações completas para gerenciar os arquivos de recursos aqui. Esses arquivos podem ser compartilhados em vários blocos de anotações depois que o bloco de anotações é anexado ao ambiente atual.
Na página Bloco de Anotações, você pode encontrar facilmente uma segunda pasta raiz em Recursos herdados do ambiente anexado.
Você também pode operar nos arquivos / pastas da mesma forma com a pasta de recursos internos.
O caminho do recurso Ambiente será montado automaticamente no cluster de notebooks, você pode usar o caminho relativo /env para acessar os recursos do ambiente.
Editor de ficheiros
O editor de arquivos permite que você visualize e edite arquivos diretamente na pasta de recursos do bloco de anotações e na pasta de recursos do ambiente no bloco de anotações. Os tipos de ficheiro suportados incluem CSV, TXT, HTML, YML, PY, SQL e muito mais. Com o editor de arquivos, você pode facilmente acessar e modificar arquivos dentro do bloco de anotações, ele suporta realce de palavra-chave e fornece o serviço de idioma necessário ao abrir e editar arquivos de código, como .py e .sql.
Pode aceder a esta funcionalidade através de 'Ver e editar' no menu de ficheiros. Clique duas vezes no arquivo é uma maneira mais rápida.
A alteração de conteúdo no editor de arquivos precisa ser salva manualmente clicando no botão Salvar ou no atalho de teclado: Ctrl+S, o editor de arquivos não suporta o salvamento automático.
O editor de arquivos também é afetado pelo modo de bloco de anotações. Só pode ver ficheiros, mas não pode editá-los se estiver no modo de bloco de notas sem permissão de edição.
Nota
Aqui estão algumas limitações para o editor de arquivos.
- O limite de tamanho do ficheiro é de 1 MB.
- Estes tipos de ficheiro não são suportados para visualização e edição: .xlsx e .parquet.
Colaborar num bloco de notas
O bloco de anotações Fabric é um item colaborativo que suporta vários usuários editando o mesmo bloco de anotações.
Quando abre um bloco de notas, entra no modo de coedição por predefinição e todas as edições do bloco de notas são guardadas automaticamente. Se seus colegas abrirem o mesmo bloco de anotações ao mesmo tempo, você verá o perfil, a saída da execução, o indicador do cursor, o indicador de seleção e o rastreamento de edição. Usando os recursos de colaboração, você pode facilmente realizar programação em pares, depuração remota e cenários de tutoria.
Partilhar um bloco de notas
Partilhar um bloco de notas é uma forma conveniente de colaborar com os membros da equipa. As funções de espaço de trabalho autorizadas podem exibir ou editar/executar blocos de anotações por padrão. Você pode compartilhar um bloco de anotações com as permissões especificadas concedidas.
Selecione Compartilhar na barra de ferramentas do bloco de anotações.
Selecione a categoria correspondente de pessoas que podem ver este bloco de notas. Você pode escolher as permissões Compartilhar, Editar ou Executar para os destinatários.
Depois de selecionar Aplicar, você pode enviar o bloco de anotações diretamente ou copiar o link para outras pessoas. Os destinatários podem então abrir o bloco de notas com a vista correspondente concedida pelo seu nível de permissão.
Para gerir ainda mais as permissões do seu bloco de notas, selecione Lista de itens>da área de trabalho Mais opções e, em seguida, selecione Gerir permissões. Nessa tela, você pode atualizar o acesso e as permissões existentes do bloco de anotações.
Comentar uma célula de código
Comentar é outro recurso útil para cenários colaborativos. Atualmente, o Fabric oferece suporte à adição de comentários no nível da célula.
Selecione o botão Comentários na barra de ferramentas do bloco de anotações ou no indicador de comentário da célula para abrir o painel Comentários .
Selecione o código na célula de código, selecione Novo no painel Comentários , adicione comentários e, em seguida, selecione Publicar comentário para salvar.
Se precisar deles, encontre as opções Editar comentário, Resolver thread e Excluir thread selecionando a opção Mais ao lado do seu comentário.
Marcar outras pessoas num comentário
"Marcação" refere-se a mencionar e notificar um usuário em um thread de comentários, aprimorando a colaboração de forma eficiente nos detalhes.
Selecione uma seção de código em uma célula e um novo thread de comentários.
Insira o nome de usuário e escolha o correto na lista de sugestões se quiser mencionar alguém para discussão sobre uma determinada seção.
Partilhe as suas ideias e publique-as .
Uma notificação por e-mail será acionada e o usuário clicará no link Abrir comentários para localizar rapidamente essa célula.
Além disso, autorize e configure as permissões para usuários ao marcar alguém que não tem acesso, garantindo que seus ativos de código sejam bem gerenciados.
Nota
Para um item de comentário, o usuário marcado não receberá mais uma notificação por e-mail se você atualizar o comentário dentro de uma hora. Mas ele enviará uma notificação por e-mail para o novo usuário marcado.
Comutador de modo de notebook
Os notebooks de malha suportam quatro modos que você pode alternar facilmente: modo de desenvolvimento , modo de execução apenas , modo de edição e modo de visualização . Cada modo mapeia para uma combinação de permissões específica. Ao compartilhar o bloco de anotações com outros membros da equipe, você pode conceder permissões adequadas aos destinatários, e eles verão o melhor modo de bloco de anotações disponível de acordo com sua permissão, e poderão alternar entre o modo para o qual têm permissão.
- Modo de desenvolvimento: permissão de leitura, execução e gravação necessária.
- Modo Executar somente: Ler, executar a permissão necessária.
- Modo de edição: permissão de leitura, gravação necessária.
- Modo de visualização: permissão de Ler necessário.