Funções de janela no mapeamento do fluxo de dados
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Gorjeta
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!
Os fluxos de dados estão disponíveis no Azure Data Factory e no Azure Synapse Pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
Os artigos a seguir fornecem detalhes sobre funções de janela suportadas pelo Azure Data Factory e pelo Azure Synapse Analytics no mapeamento de fluxos de dados.
Lista de funções da janela
As funções a seguir só estão disponíveis em transformações de janela.
Função janela | Task |
---|---|
cumeDist | A função CumeDist calcula a posição de um valor em relação a todos os valores na partição. O resultado é o número de linhas anteriores ou iguais à linha atual na ordenação da partição dividido pelo número total de linhas na partição da janela. Qualquer valor de empate na ordem será avaliado para a mesma posição. |
denseRank | Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores não produzirão lacunas na sequência. A classificação densa funciona mesmo quando os dados não são classificados e procura alterações nos valores. |
Defasagem | Obtém o valor do primeiro parâmetro avaliado n linhas antes da linha atual. O segundo parâmetro é o número de linhas para olhar para trás e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado. |
Chumbo | Obtém o valor do primeiro parâmetro avaliado n linhas após a linha atual. O segundo parâmetro é o número de linhas para olhar para a frente e o valor padrão é 1. Se não houver tantas linhas, um valor de null será retornado, a menos que um valor padrão seja especificado. |
nTile | A NTile função divide as linhas de cada partição de janela em n buckets que variam de 1 a, no máximo n . Os valores do bucket serão diferentes em, no máximo, 1. Se o número de linhas na partição não se dividir uniformemente no número de buckets, os valores restantes serão distribuídos um por bucket, começando com o primeiro bucket. A NTile função é útil para o cálculo de tertiles quartis, decis e outras estatísticas resumidas comuns. A função calcula duas variáveis durante a inicialização: O tamanho de um bucket regular terá uma linha extra adicionada a ele. Ambas as variáveis são baseadas no tamanho da partição atual. Durante o processo de cálculo, a função controla o número da linha atual, o número do bucket atual e o número da linha na qual o bucket será alterado (bucketThreshold). Quando o número de linha atual atinge o limite do bucket, o valor do bucket é aumentado em um e o limite é aumentado pelo tamanho do bucket (mais um extra se o bucket atual for acolchoado). |
Posição | Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores produzirão lacunas na sequência. A classificação funciona mesmo quando os dados não são ordenados e procura alterações nos valores. |
número-linha | Atribui uma numeração de linha sequencial para linhas em uma janela que começa com 1. |
Conteúdos relacionados
- Lista de todas as funções agregadas.
- Lista de todas as funções da matriz.
- Lista de todas as funções de pesquisa em cache.
- Lista de todas as funções de conversão.
- Lista de todas as funções de data e hora.
- Lista de todas as funções de expressão.
- Lista de todas as funções do mapa.
- Lista de todas as metafunções.
- Detalhes de uso de todas as expressões de transformação de dados.
- Saiba como usar o Construtor de Expressões.