Solucionar problemas de replicação lenta e migração paralisada no VMware sem agente

Este artigo ajuda você a resolver problemas de replicação lenta ou migração paralisada que podem acontecer ao replicar VMs locais do VMware usando o método sem agente de Migrações para Azure: Migração de Servidores.

A replicação está lenta ou paralisada para a VM

Durante as replicações, você pode observar que a replicação de uma VM específica não está avançando no ritmo esperado. Normalmente, a causa associado a esse problema é a falta ou escassez de alguns recursos necessários para a replicação. Outras VMs que estão replicando ou algum outro processo em execução no dispositivo no datacenter podem estar consumindo os recursos.

A seguir estão algumas causas comuns desse problema e suas soluções.

O tamanho do buffer NFC é insuficiente

O dispositivo de Migrações para Azure opera com a restrição de usar 32 MB de buffer NFC para replicar simultaneamente 8 discos no host ESXi. Um tamanho de buffer NFC inferior a 32 MB pode resultar em replicação lenta. Você também pode se deparar com a seguinte exceção:

Exceção: GatewayErrorHandling.GatewayServiceException: a operação falhou com o erro "Falha na alocação de memória. Memória insuficiente."

Remediação

Você pode aumentar o tamanho do buffer NFC para mais de 32 MB a fim de melhorar a simultaneidade. A configuração precisa ser feita no host ESXi e no dispositivo. Caso contrário, a replicação pode ter um desempenho ainda pior.

Cuidado

Aumentar o tamanho para mais de 32 MB pode gerar restrições de recursos no ambiente. Antes de continuar, confira a Administração do Sistema para entender as consequências.

Alterações no host ESXi

  1. SSH para o host ESXi como raiz.

  2. Use o editor vi para abrir "/etc/vmware/hostd/config.xml".

  3. Localize a seção semelhante à mostrada abaixo:

    <nfcsvc> 
    <enabled>true</enabled> 
    <maxMemory>134217728</maxMemory> 
    <maxStreamMemory>10485760</maxStreamMemory> 
    <path>libnfcsvc.so</path> 
    </nfcsvc> 
    
  4. Altere o valor da maxMemory para o valor (em Bytes) que deseja configurar para o buffer NFC. Neste exemplo, ela está definida para 128 MB (128 * 1024 * 1024).

  5. Salve e saia.

  6. Reinicie os agentes de gerenciamento pelo shell usando os seguintes comandos:

    • /etc/init.d/hostd restart
    • /etc/init.d/vpxa restart

Alterações no dispositivo

  1. Entre no dispositivo de Migrações para Azure como administrador usando a Área de Trabalho Remota.
  2. Abra o arquivo GatewayDataWorker.json na pasta "%programdata%\Microsoft Azure\Config".
  3. Se o arquivo json não existir, crie um novo arquivo vazio e insira o texto a seguir.
    { 
     "HostBufferSizeInMB": "32", 
    } 
    
  4. Altere o valor de HostBufferSizeInMB para o valor que você configurou no host ESXi.
  5. Salve e saia.
  6. Reinicie o serviço de gateway das Migrações para Azure que está em execução no dispositivo. Abra o PowerShell e execute o seguinte:
    • net stop asrgwy (aguarde o serviço parar)
    • net start asrgwy

A RAM disponível no host ESXi é insuficiente

Quando o host ESXi que hospeda a VM em replicação está sobrecarregado, o processo de replicação pode ficar lento devido à falta de RAM.

Remediação

Utilize o VMotion para transferir a VM com replicação lenta para um host ESXi menos sobrecarregado.

Largura de banda da rede

As replicações podem estar lentas devido à baixa largura de banda de rede disponível para o dispositivo de Migrações para Azure. A largura de banda reduzida pode ser causada por outros aplicativos que estão consumindo a largura de banda ou pela presença de aplicativos que limitam a largura de banda ou configurações de proxy que restringem o uso da largura de banda pelo dispositivo de replicações.

Remediação

Em caso de largura de banda reduzida, tente diminuir o número de aplicativos que usam a rede. Verifique com o administrador de rede se existe alguma configuração de proxy ou aplicativo de limitação.

E/S de disco

O servidor que está sendo replicado pode estar com muita carga, causando altas operações de I/O nos discos conectados a ele, o que pode deixar as replicações lentas. Recomenda-se reduzir a carga no servidor para acelerar a replicação. Você também pode encontrar o seguinte erro:

O último ciclo de replicação para a máquina virtual "Nome da VM" falhou. Evento de tempo limite encontrado.

Se nenhuma medida for tomada, a replicação continuará e será concluída com atraso.

Taxas de gravação no disco

As replicações podem estar mais lentas que o esperado se a velocidade de upload dos dados for superior à velocidade de gravação no disco selecionado durante a ativação da replicação. Para alcançar velocidades melhores nas mesmas taxas de upload, será necessário reiniciar a replicação e selecionar Premium ao definir o tipo de disco para replicação.

Cuidado

O tipo de disco recomendado durante a Avaliação pode não ser Premium para uma VM em particular. Neste caso, não é recomendável mudar para um disco Premium para aumentar a velocidade de replicação, já que após a migração talvez não seja necessário manter um disco Premium vinculado a essa VM.

A operação de migração na VM está paralisada

Ao disparar a migração para uma VM específica, você pode observar que a migração está paralisada em alguma fase (na fila ou sincronização delta) por mais tempo do que o esperado. Normalmente, a causa associado a esse problema é a falta ou escassez de alguns recursos necessários para a migração. Outras VMs que estão replicando ou algum outro processo em execução no dispositivo no datacenter podem estar consumindo os recursos. A seguir estão algumas causas comuns desse problema e as soluções.

O tamanho do buffer NFC é insuficiente

Se um ciclo de runtime de integração (IR) para um servidor com discos grandes estiver em andamento enquanto a migração for disparada para uma segunda VM, o trabalho de migração da segunda VM pode ficar paralisado. Embora os trabalhos de migração tenham alta prioridade, é possível que o buffer NFC não fique disponível para a migração. Nesse caso, recomendá-se interromper ou pausar a replicação inicial de servidores com discos grandes e concluir a migração da segunda VM.

O ciclo de sincronização delta em andamento não está concluído

Se a migração for disparada durante um ciclo de replicação delta em andamento, ela ficará na fila. O ciclo de replicação delta na VM será finalizado antes de iniciar a migração. O tempo necessário para disparar a migração depende do tempo necessário para concluir um ciclo de sincronização delta.

O desligamento da VM local está demorando mais do que o normal

Tente migrar sem desligar a VM ou desativar a VM manualmente e, em seguida, continue com a migração.

Próximas etapas

Saiba mais sobre como migrar VMs VMware.