Considerações e limitações sobre fluxo de dados
Há algumas limitações dos fluxos de dados que os usuários devem ter em mente, relativas à criação, às atualizações e ao gerenciamento de capacidade, conforme descrito nas seções a seguir.
Limitações gerais
- Os fluxos de dados podem não estar disponíveis para todos os clientes do DoD do governo dos EUA. A paridade de recursos entre ambientes governamentais pode ser encontrada no artigo Disponibilidade do recurso do Power BI para governo.
- As fontes de dados excluídas não são removidas da página da fonte de dados do fluxo de dados, o que é um comportamento benigno e não afeta a atualização ou a edição de fluxos de dados. No Modo de Exibição de Linhagem , as fontes de dados excluídas aparecem como linhagem para um fluxo de dados.
- Os recursos de dados excluídos ainda aparecem na página Configuração no menu suspenso do gateway.
- A profundidade é igual a fluxos de dados vinculados a outros fluxos de dados. A profundidade máxima atual é 32.
- A amplitude é igual a entidades dentro de um fluxo de dados.
- Não há nenhuma orientação ou limite para o número ideal de entidades em um fluxo de fluxos. No entanto, os fluxos de dados compartilhados tem um limite de atualização de duas horas por entidade e três por fluxo de dados. Portanto, se você tiver duas entidades e cada uma delas levar duas horas, você não deverá colocá-las no mesmo fluxo de dados.
- Para o Power BI Premium, as diretrizes e os limites são baseados em casos de uso individuais, e não em requisitos específicos. O único limite do Power BI Premium é uma atualização de 24 horas por fluxo de dados.
- É necessária uma assinatura do Power BI Premium para atualizar mais de 10 fluxos de dados entre espaços de trabalho.
- As limitações do PowerQuery podem ser encontradas no artigo Limites do Power Query Online.
- Os fluxos de dados do Power BI não dão suporte ao uso de variáveis globais em um argumento de URL.
- Atualmente, não há suporte para o Multi-Geo, a menos que configure o armazenamento para usar sua própria conta de armazenamento do Azure Data Lake Gen2.
- O suporte a Vnet é obtido usando um gateway.
- Quando você usa Entidades Computadas com fontes de dados de gateway, a ingestão de dados deve ser realizada em fontes de dados diferentes das computações. As entidades computadas devem se basear em entidades que são usadas apenas para ingestão e não ingerir dados em suas próprias etapas de mashup.
- Nos fluxos de dados do Power BI, você pode usar parâmetros, mas não pode editá-los, a menos que edite todo o fluxo de dados. Nesse sentido, os parâmetros nos fluxos de dados se comportam de maneira semelhante às constantes declaradas.
- Alguns conectores encontrados em Solucionar problemas em cenários de atualização não têm suporte para fluxos de dados e datamarts em workspaces Premium.
- Ao usar o DirectQuery com um fluxo de dados, as pesquisas que usam o visual da segmentação de dados diferenciam maiúsculas de minúsculas.
Criação de fluxo de dados
Ao criar fluxos de dados, esteja atento às seguintes considerações:
A criação em fluxos de dados é feita no ambiente Power Query Online (PQO); consulte as limitações descritas em Limites do Power Query. Como a criação de fluxos de dados é feita no ambiente do Power Query Online (PQO), as atualizações realizadas nas configurações da carga de trabalho de fluxos de dados afetam apenas as atualizações e não afetam a experiência de criação.
Os fluxos de dados podem ser modificados apenas por seus proprietários.
Os fluxos de dados não estão disponíveis em Meu Espaço de Trabalho.
Os fluxos de dados que usam fontes de dados de gateway não têm suporte para várias credenciais para a mesma fonte de dados.
O uso do conector Web.Page exige um gateway.
Na experiência de edição dos fluxos de dados Gen1, os usuários talvez não consigam remover uma conexão de Gateway de dados local do fluxo de dados usando Opçcões>Projeto>Carga de dados>selecionar (nenhum) na lista suspensa Gateway de dados. As seguintes etapas podem resolver o problema:
- Comece a editar o fluxo de dados no qual você deseja remover a conexão do Gateway de Dados local.
- Selecione Opções>Carga de dados do Projeto>Gateway de dados, selecione Nenhum e, em seguida, OK.
- Se um aviso amarelo com um botão "Configurar conexão" for exibido, selecione "Configurar conexão", selecione a conexão de nuvem na caixa suspensa e insira as credenciais, se necessário, para a conexão de nuvem.
- Selecione Gerenciar conexões> e selecione o botão desvincular da conexão do Gateway.
- Feche a caixa de diálogo Gerenciar conexões, se exigir que você "Configure conexão" novamente, faça isso. Selecione Salvar e fechare aguarde a conclusão da operação de salvamento.
- Se o aviso "Configurar conexão" não aparecer depois de aplicar as etapas anteriores, aplique as etapas anteriores, salve e feche o fluxo de dados, edite-o novamente e verifique se o aviso "Configurar conexão" será exibido para que você tome medidas sobre ele.
Se a conexão com o Gateway ainda não for removida do fluxo de dados, talvez seja necessário recriar um novo fluxo de dados com as mesmas consultas, não associadas ao Gateway.
Considerações sobre API
Mais informações sobre as APIs REST de fluxos de dados compatíveis podem ser encontradas na referência da API REST. Aqui estão algumas considerações para ter em mente:
A exportação e a importação de um fluxo de dados dão a esse fluxo de dados uma nova ID.
A importação de fluxos de dados que contêm tabelas vinculadas não atualiza as referências existentes no fluxo de dados (essas consultas devem ser atualizadas manualmente antes de importar o fluxo de dados).
Ao implantar um fluxo de dados, você pode usar os manipuladores de conflito GenerateUniqueName e Abort para abortar a operação quando ela já existir ou instruir a API a criar automaticamente um nome exclusivo. Os fluxos de dados podem ser substituídos pelo parâmetro CreateOrOverwrite, se tiverem sido criados inicialmente usando a API de importação.
Fluxos de dados em capacidades compartilhadas
Existem limitações para fluxos de dados em capacidades compartilhadas (capacidades não Premium):
- Quando um fluxo de dados é atualizado, os tempos limite em uma capacidade compartilhada são de 2 horas por tabela e 3 horas por fluxo de dados.
- As tabelas vinculadas não podem ser criadas em fluxos de dados compartilhados, embora possam existir no fluxo de dados, desde que a propriedade Carregamento Habilitado da consulta esteja desabilitada.
- As tabelas computadas não podem ser criadas nos fluxos de dados compartilhados.
- Os serviços AutoML e Cognitivos não estão disponíveis nos fluxos de dados compartilhados.
- A atualização incremental não funciona nos fluxos de dados compartilhados.
Fluxos de dados no Premium
Os fluxos de dados que existem no Premium têm as considerações e limitações a seguir.
Atualizações e considerações de dados:
Ao atualizar os fluxos de dados, os tempos limite são de 24 horas (sem distinção para tabelas e/ou fluxos de dados).
A alteração de um fluxo de dados de uma política de atualização incremental para uma atualização normal, ou vice-versa, elimina todos os dados.
A modificação do esquema de um fluxo de dados elimina todos os dados.
Ao usar uma licença Premium por Usuário (PPU) com fluxos de dados, os dados são limpos ao mover os dados para fora de um ambiente de PPU.
Quando um fluxo de dados é atualizado em um contexto Premium Por Usuário (PPU), os dados não ficam visíveis para usuários que não são do PPU.
A atualização incremental funciona com fluxos de dados somente quando o mecanismo de computação aprimorado está habilitado.
Tabelas vinculadas e computadas:
As tabelas vinculadas podem chegar a uma profundidade de 32 referências.
Não são permitidas dependências cíclicas de tabelas vinculadas.
Uma tabela vinculada não pode ser unida a uma tabela normal que obtém seus dados de uma fonte de dados local.
Quando uma consulta (consulta A, por exemplo) é usada no cálculo de outra consulta (consulta B) em fluxos de dados, a consulta B torna-se uma tabela calculada. As tabelas calculadas não podem se referir a fontes locais.
Mecanismo de computação:
Ao usar o Mecanismo de computação, há um aumento inicial aproximado de 10% a 20% no tempo para a ingestão de dados.
- Isso só se aplica ao primeiro fluxo de dados que está no mecanismo de computação e lê dados da fonte de dados.
- Os fluxos de dados subsequentes que usam o fluxo de dados de origem não incorrem na mesma penalidade.
Somente algumas operações usam o mecanismo de computação e somente quando usadas por uma tabela vinculada ou como uma tabela computada. Uma lista completa de operações está disponível nesta postagem de blog.
Gerenciamento de capacidade:
Por padrão, as capacidades do Power BI Premium têm um Resource Manager interno que restringe as cargas de trabalho de maneiras diferentes quando a capacidade está sendo executada com memória insuficiente.
- Para fluxos de dados, essa pressão de limitação reduz o número de contêineres M disponíveis.
- A memória para fluxos de dados pode ser definida como 100%, com um contêiner de tamanho adequado para os tamanhos dos dados, e a carga de trabalho gerenciará o número de contêineres adequadamente.
O número aproximado de contêineres pode ser determinado dividindo-se a memória total alocada para a carga de trabalho pela quantidade de memória alocada para um contêiner.
Uso do fluxo de dados em modelos semânticos
- Ao criar um modelo semântico no Power BI Desktop e depois publicá-lo no serviço do Power BI, as credenciais usadas no Power BI Desktop para a fonte de dados de fluxos de dados devem ser as mesmas usadas quando o modelo semântico for publicado no serviço.
- Caso essas credenciais não sejam as mesmas, ocorrerá o erro Chave não encontrada na atualização do modelo semântico.
Observação
Se a estrutura de fluxo de dados for alterada, como uma coluna nova ou renomeada, o modelo semântico não mostrará a alteração, que também poderá fazer com que uma atualização de dados falhe no serviço do Power BI do modelo semântico, até que seja atualizado no Power BI Desktop e publicado novamente.
Fluxos de dados e conexões nomeadas
Ao usar fluxos de dados com conexões nomeadas, as seguintes limitações se aplicam:
- Você só pode criar uma conexão de nuvem de um determinado caminho e tipo, por exemplo, você só pode criar uma conexão de nuvem de servidor/banco de dados SQL Plus. Você pode criar várias conexões de gateway.
- Você não pode nomear ou renomear fontes de dados na nuvem; você pode nomear ou renomear conexões de gateway.
Limitações do ADLS
- O ADLS não está disponível em ambientes GCC, GCC High ou DOD. Confira Power BI para clientes do governo dos EUA para obter mais informações.
- Você deve ser proprietário do recurso, devido a alterações nas APIs do ADLS Gen 2.
- Não há suporte para a migração de assinatura do Azure, mas há duas alternativas para fazer isso:
- Primeira abordagem: após a migração, o usuário poderá desanexar workspaces e reanexá-los. Se estiver usando a conta de nível de locatário, você deverá desanexar todos os workspaces, desanexar no nível do locatário e reanexá-los. Isso pode ser indesejável para clientes que não querem excluir todos os seus fluxos de dados nem ter muitos workspaces.
- Segunda abordagem: se a abordagem anterior não for viável, envie uma solicitação de suporte para alterar a ID da assinatura no banco de dados.
- O ADLS não dá suporte à maioria dos elementos na lista da seção Diretórios e nomes de arquivo do artigo para nomenclatura de workspace e de fluxo de dados, devido às seguintes limitações:
- O Power BI retorna um erro não útil ou permite que o processo aconteça, mas a atualização falhará.
- Não há suporte para assinaturas do ADLS entre locatários. O ADLS anexado ao Power BI deve fazer parte do mesmo locatário do Azure que o Power BI usa no Microsoft Entra ID.
Tipos de dados de fluxo de dados
Os tipos de dados compatíveis com os fluxos de dados são os seguintes:
Tipo de dados de mashup | Tipo de dados de fluxo de dados |
---|---|
Hora | Hora |
Data | Data |
Datetime | DateTime |
DateTimeZone | DateTimeOffset |
Lógico | Boolean |
Texto | Cadeia de caracteres |
Qualquer | String |
Moeda | Decimal |
Int8 | Int64 |
Int16 | Int64 |
Int32 | Int64 |
Int64 | Int64 |
Double | Double |
Percentual | Double |
Single | Double |
Decimal | Double |
Número | Double |
Duration | Sem suporte |
Binário | Sem suporte |
Função | Sem suporte |
Tabela | Sem suporte |
Lista | Sem suporte |
Record | Sem suporte |
Tipo | Sem suporte |
Ação | Sem suporte |
Nenhum | Sem suporte |
Nulo | Sem suporte |
Conteúdo relacionado
Os seguintes artigos fornecem mais informações sobre os fluxos de dados e o Power BI:
- Introdução aos fluxos de dados e à preparação de dados de autoatendimento
- Criar um fluxo de dados
- Configurar e consumir um fluxo de dados
- Como configurar o armazenamento de Fluxos de dados para usar o Azure Data Lake Gen 2
- Recursos Premium de fluxos de dados
- IA com fluxos de dados
- Melhores práticas de fluxos de dados