Agregar funções no mapeamento do fluxo de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Os artigos a seguir fornecem detalhes sobre funções agregadas suportadas pelo Azure Data Factory e pelo Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções agregadas

As funções a seguir estão disponíveis apenas em transformações agregadas, dinâmicas, desdinâmicas e de janelas.

Função agregar Task
approxDistinctCount Obtém a contagem agregada aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa.
Preço médio Obtém a média dos valores de uma coluna.
avgSe Com base em um critério, obtém-se a média dos valores de uma coluna.
Recolha Coleta todos os valores da expressão no grupo agregado em uma matriz. As estruturas podem ser recolhidas e transformadas em estruturas alternativas durante este processo. O número de itens será igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens recolhidos deve ser pequeno.
collectUnique Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. As estruturas podem ser recolhidas e transformadas em estruturas alternativas durante este processo. O número de itens será menor ou igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens recolhidos deve ser pequeno.
count Obtém a contagem agregada de valores. Se a(s) coluna(s) opcional(is) for especificada(s), ela ignorará os valores NULL na contagem.
contarTodos Obtém a contagem agregada de valores, incluindo NULLs.
contagemDistinto Obtém a contagem agregada de valores distintos de um conjunto de colunas.
contarAllDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo NULLs.
contarSe Com base em um critério, obtém-se a contagem agregada de valores. Se a coluna opcional for especificada, ela ignorará os valores NULL na contagem.
covariânciaPopulação Obtém a covariância populacional entre duas colunas.
covariânciaPopulaçãoSe Com base em um critério, obtém a covariância populacional de duas colunas.
covariânciaAmostra Obtém a covariância de amostra de duas colunas.
covariânciaAmostraSe Com base em um critério, obtém a covariância de amostra de duas colunas.
primeiro Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, ele será assumido false.
isDistinct Localiza se uma coluna ou conjunto de colunas é distinto. Ele não conta nulo como um valor distinto
Curtose Obtém a curtose de uma coluna.
KurtosisSe Com base em um critério, obtém a curtose de uma coluna.
último Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, ele será assumido false.
máx. Obtém o valor máximo de uma coluna.
maxSe Com base em um critério, obtém o valor máximo de uma coluna.
média Obtém a média dos valores de uma coluna. O mesmo que o AVG.
médiaSe Com base em um critério, obtém-se a média dos valores de uma coluna. O mesmo que avgIf.
min Obtém o valor mínimo de uma coluna.
minSe Com base em um critério, obtém o valor mínimo de uma coluna.
assimetria Obtém a assimetria de uma coluna.
assimetriaSe Com base em um critério, obtém a assimetria de uma coluna.
Stddev Obtém o desvio padrão de uma coluna.
stddevSe Com base em um critério, obtém o desvio padrão de uma coluna.
stddevPopulação Obtém o desvio padrão da população de uma coluna.
stddevPopulationIf Com base em um critério, obtém o desvio padrão da população de uma coluna.
stddevSample Obtém o desvio padrão de amostra de uma coluna.
stddevSampleIf Com base em um critério, obtém o desvio padrão da amostra de uma coluna.
soma Obtém a soma agregada de uma coluna numérica.
somaDistinto Obtém a soma agregada de valores distintos de uma coluna numérica.
sumDistinctIf Com base em critérios, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna.
somaSe Com base em critérios, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna.
topN Obtém os principais valores N para esta coluna.
variância Obtém a variância de uma coluna.
variânciaSe Com base em um critério, obtém a variância de uma coluna.
variânciaPopulação Obtém a variação populacional de uma coluna.
variânciaPopulaçãoSe Com base em um critério, obtém a variância populacional de uma coluna.
variânciaAmostra Obtém a variância imparcial de uma coluna.
variânciaAmostraSe Com base em um critério, obtém a variância imparcial de uma coluna.