Linhagem de dados

A linhagem de dados desempenha um papel importante na análise em escala de nuvem. Ela mostra dependências entre dados brutos e produtos acabados e descreve as transformações e manipulações que transformam esses dados brutos nos produtos de dados finais. A linhagem de dados abrange o ciclo de vida dos dados, desde sua origem até sua movimentação pelo patrimônio de dados. É usado para solução de problemas, análise de causa raiz, análise de qualidade de dados, conformidade e análise de impacto. Além disso, ela adiciona contexto a conjuntos de dados e produtos que viabilizam produtos de dados detectáveis e que podem ser operados autonomamente.

Um dos principais pontos de qualquer catálogo de dados é sua capacidade de mostrar a linhagem entre produtos de dados.

O Catálogo de Dados do Microsoft Purview se conecta a vários sistemas de processamento, armazenamento e análise de dados para extrair informações de linhagem. O objetivo é representar o movimento, a transformação e os metadados operacionais de cada sistema de dados.

O Azure Data Factory e pipelines do Azure Synapse são recomendados para soluções de ingestão porque habilitam a linhagem de dados no Microsoft Purview. Outros padrões de ingestão devem usar a API do Apache Atlas para atualizar a linhagem de dados como parte do processamento de dados.

O Microsoft Fabric dá suporte à linhagem sem exigir o Microsoft Purview. Se você precisar de um local para exibir a linhagem, recomendamos configurar o Microsoft Purview para examinar um locatário do Microsoft Fabric, pois isso trará automaticamente metadados e linhagem de itens do Fabric, incluindo o Power BI, para o Catálogo de Dados do Microsoft Purview. Para obter mais informações, consulte Linhagem no Fabric e Como obter linhagem de itens do Microsoft Fabric no Microsoft Purview

Dica

Para obter mais informações sobre sistemas com suporte e práticas recomendadas, consulte Linhagem de dados no Microsoft Purview.

Próximas etapas

Saiba como gerenciar dados mestre no Azure.