Cenário de preços usando um pipeline de dados para carregar 1 TB de dados do Parquet em um data warehouse

Nesse cenário, uma atividade de cópia foi usada em um pipeline de dados para carregar 1 TB de dados da tabela Parquet armazenados no Azure Data Lake Storage (ADLS) Gen2 para um data warehouse no Microsoft Fabric.

Os preços usados no exemplo a seguir são hipotéticos e não pretendem implicar preços reais exatos. Estes são apenas para demonstrar como você pode estimar, planejar e gerenciar o custo para projetos do Data Factory no Microsoft Fabric. Além disso, como as capacidades de malha têm preços exclusivos entre regiões, usamos o preço pré-pago para uma capacidade de malha no Oeste dos EUA 2 (uma região típica do Azure), a US$ 0,18 por por hora. Consulte aqui Microsoft Fabric - Pricing para explorar outras opções de preços de capacidade de malha.

Configuração

Para realizar esse cenário, você precisa criar um pipeline com a seguinte configuração:

Screenshot showing the configuration of a pipeline copying Parquet data from ADLS Gen2 to a data warehouse.

Estimativa de custos usando o aplicativo Fabric Metrics

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

A operação de movimentação de dados utilizou 3.960 segundos com uma duração de 662,64 segundos, enquanto a operação de execução de atividade foi nula, uma vez que não havia nenhuma atividade sem cópia na execução do pipeline.

Nota

Embora relatada como uma métrica, a duração real da execução não é relevante ao calcular as horas efetivas com o Fabric Metrics App, uma vez que a métrica segundos que ela também relata já contabiliza sua duração.

Metric Operação de movimentação de dados
segundos 3.960 segundos
-horas efetivas (3.960) / (60*60)-horas = 1,1-horas

Custo total de execução em $0.18/hora = (1.1-hora) * ($0.18/hora ) ~= $0.20