Pipelines de implantação do Lakehouse e integração do Git (Versão Prévia)

O Lakehouse integra-se aos recursos de gerenciamento do ciclo de vida no Microsoft Fabric, fornecendo uma colaboração padronizada entre todos os membros da equipe de desenvolvimento ao longo da vida útil do produto. O gerenciamento do ciclo de vida facilita um processo eficaz de versão e lançamento do produto, fornecendo continuamente recursos e correções de bugs em vários ambientes. Para saber mais, consulte O que é o gerenciamento do ciclo de vida no Microsoft Fabric?.

Importante

Esse recurso está em versão prévia.

Integração do Git do Lakehouse

O Lakehouse é um item que contém metadados e dados referenciados em vários objetos no espaço de trabalho. O Lakehouse contém tabelas, pastas e atalhos como itens de contêiner de dados gerenciáveis primários. Do ponto de vista do fluxo de trabalho de desenvolvimento, os seguintes objetos dependentes podem referenciar um Lakehouse:

O modelo semântico padrão e os metadados de ponto de extremidade de análise do SQL, estão relacionados a um Lakehouse e gerenciados pelo processo de atualização do Git por padrão. Como um princípio os dados não são rastreados no Git, somente os metadados são rastreados.

Representação do Git

As seguintes informações do lakehouse são serializadas e rastreadas em um espaço de trabalho conectado ao Git:

  • Nome de exibição
  • Descrição
  • GUID lógico

Observação

O GUID lógico rastreado é um identificador entre espaços de trabalho gerado automaticamente representando um item e sua representação de controle da fonte.

Importante

Somente o artefato de contêiner lakehouse é rastreado no git na experiência atual. Tabelas, pastas, atalhos e outras alterações de metadados não são controladas e não possuem controle de versão no git.

Recursos de integração do Git do Lakehouse

Os seguintes recursos estão disponíveis:

  • Serialização dos metadados do objeto Lakehouse para uma representação JSON do Git.
  • Aplique alterações diretamente ou use a solicitação de pull para controlar alterações em espaços de trabalho e branches upstream ou downstream.
  • Renomear lakehouses são rastreados no Git. Atualizar um lakehouse renomeado também renomeia o modelo de dados semânticos padrão e o ponto de extremidade da análise do SQL.
  • Nenhuma ação é aplicada a tabelas, pastas e atalhos, metadados e dados desses itens é sempre preservada.

Lakehouse em pipelines de implantação

O Lakehouse tem suporte nos pipelines de implantação de gerenciamento do ciclo de vida do Microsoft Fabric. Ele habilita a segmentação de ambiente melhores práticas.

Pipelines de implantação do Lakehouse e integração do Git:

  • Implantação em espaços de trabalho de desenvolvimento, teste e produção.

  • Lakehouse pode ser removido como um objeto dependente após a implantação. Também há suporte para mapeamento de diferentes Lakehouses no contexto do pipeline de implantação.

    • Se nada for especificado durante a configuração do pipeline de implantação, um novo objeto Lakehouse vazio com o mesmo nome será criado no workspace de destino. As Definições de Trabalho do Notebook e do Spark são remapeadas para fazer referência ao novo objeto Lakehouse no novo espaço de trabalho.

    • Se a dependência Lakehouse estiver configurada para fazer referência a um Lakehouse diferente durante o tempo de configuração do pipeline de implantação, como o Lakehouse upstream, um novo objeto Lakehouse vazio com o mesmo nome ainda será criado no workspace de destino, mas as referências de Notebooks e Definições de Trabalho do Spark serão preservadas para um Lakehouse diferente, conforme solicitado.

    • Os pontos de extremidade de análise do SQL e modelos semânticos, são provisionados como parte da implantação do Lakehouse.

  • Nenhum objeto dentro do Lakehouse é substituído.

  • As atualizações para o nome Lakehouse podem ser sincronizadas entre espaços de trabalho em um contexto de pipeline de implantação.