Configurando pools iniciais no Microsoft Fabric

Neste artigo, explicamos como personalizar pools iniciais no Microsoft Fabric para suas cargas de trabalho de análise. Os pools iniciais são uma maneira rápida e fácil de usar o Spark na plataforma Microsoft Fabric em segundos. Você pode usar as sessões do Spark imediatamente, em vez de esperar que o Spark configure os nós para você, o que ajuda você a fazer mais com dados e obter insights mais rapidamente.

As piscinas iniciais têm clusters Spark que estão sempre ligados e prontos para os seus pedidos. Eles usam nós de tamanho médio e podem ser ampliados com base em seus requisitos de carga de trabalho.

Você pode especificar os nós máximos para dimensionamento automático com base nos requisitos de carga de trabalho de engenharia de dados ou ciência de dados. Com base nos nós máximos configurados, o sistema adquire e desativa dinamicamente os nós à medida que os requisitos de computação da tarefa mudam, o que resulta em dimensionamento eficiente e melhor desempenho.

Você também pode definir o limite máximo para executores em pools iniciais e, com a Alocação Dinâmica habilitada, o sistema ajusta o número de executores dependendo do volume de dados e das necessidades de computação no nível do trabalho. Esse processo permite que você se concentre em suas cargas de trabalho sem se preocupar com otimização de desempenho e gerenciamento de recursos.

Nota

Para personalizar um pool inicial, você precisa de acesso de administrador ao espaço de trabalho.

Configurar pools iniciais

Para gerenciar o pool inicial associado ao seu espaço de trabalho:

  1. Vá para o seu espaço de trabalho e escolha as configurações do espaço de trabalho.

    Captura de tela mostrando onde selecionar Engenharia de Dados no menu Configurações do espaço de trabalho.

  2. Em seguida, selecione a opção Engenharia de Dados/Ciência para expandir o menu.

    Captura de ecrã a mostrar a vista de detalhes das Definições do Spark.

  3. Selecione a opção StarterPool .

    Captura de tela mostrando as opções de configuração do pool inicial.

  4. Você pode definir a configuração máxima do nó para seus pools iniciais para um número permitido com base na capacidade comprada ou reduzir a configuração padrão do nó máximo para um valor menor ao executar cargas de trabalho menores.

    Captura de tela mostrando as opções de nó máximo do pool inicial e executor máximo para dimensionamento automático e alocação dinâmica.

A seção a seguir lista várias configurações padrão e os limites máximos de nós suportados para pools iniciais com base em SKUs de capacidade do Microsoft Fabric:

Nome da SKU Unidades de capacidade Spark VCores Tamanho do nó Nós máximos padrão Número máximo de nós
F2 2 4 Médio 1 1
F4 4 8 Médio 1 1
F8 8 16 Médio 2 2
F16 16 32 Médio 3 4
F32 32 64 Médio 8 8
F64 64 128 Médio 10 16
(Capacidade experimental) 64 128 Médio 10 16
F128 128 256 Médio 10 32
F256 256 512 Médio 10 64
F512 512 1024 Médio 10 128
F1024 1024 2048 Médio 10 200
F2048 2048 4096 Médio 10 200

Nota

Para personalizar um pool inicial, você precisa de acesso de administrador ao espaço de trabalho.