Quais são as opções para migrar dados do MongoDB para o Azure Cosmos DB para MongoDB baseado em vCore?

Este documento descreve as várias opções para elevar e mudar suas cargas de trabalho do MongoDB para a oferta do Azure Cosmos DB para MongoDB baseada em vCore.

As migrações podem ser feitas de duas maneiras:

  • Migração offline: uma cópia em massa baseada em instantâneo da origem para o destino. Novos dados adicionados/atualizados/excluídos na origem depois que o instantâneo não é copiado para o destino. O tempo de inatividade do aplicativo necessário depende do tempo necessário para a conclusão da atividade de cópia em massa.

  • Migração online: Além da atividade de cópia de dados em massa feita na migração offline, um fluxo de alterações monitora todas as adições/atualizações/exclusões. Depois que a cópia de dados em massa for concluída, os dados no fluxo de alterações serão copiados para o destino para garantir que todas as atualizações feitas durante o processo de migração também sejam transferidas para o destino. O tempo de inatividade do aplicativo necessário é mínimo.

Azure Data Studio (Online)

A extensão de migração do MongoDB para o Azure Data Studio é a ferramenta preferida na migração de suas cargas de trabalho do MongoDB para o Azure Cosmos DB para MongoDB baseado em vCore.

O processo de migração tem duas fases:

  • Avaliação pré-migração - Uma avaliação do seu conjunto de dados atual do MongoDB para determinar se há alguma incompatibilidade.
  • Migração - A operação de migração usando serviços gerenciados pelo Azure.

Avaliação pré-migração

A avaliação envolve descobrir se você está usando os recursos e a sintaxe suportados. O objetivo desta etapa é identificar quaisquer incompatibilidades ou avisos existentes na solução MongoDB atual. Você deve resolver os problemas encontrados nos resultados da avaliação antes de prosseguir com o processo de migração.

Gorjeta

Recomendamos que você revise os recursos e a sintaxe suportados em detalhes e execute uma prova de conceito antes da migração real.

Migração

Use a interface gráfica do usuário para gerenciar todo o processo de migração do início ao fim. A migração é iniciada no Azure Data Studio, mas é executada na nuvem em recursos gerenciados pelo Azure.

Ferramentas nativas do MongoDB (Offline)

Você pode usar as ferramentas nativas do MongoDB, como mongodump/mongorestore, mongoexport/mongoimport para migrar conjuntos de dados offline (sem replicar alterações em tempo real) para a oferta do Azure Cosmos DB para MongoDB baseada em vCore.

Cenário Ferramenta nativa do MongoDB
Mover subconjunto de dados de banco de dados (baseado em JSON/CSV) Mongoexport/MongoImport
Mover todo o banco de dados (baseado em BSON) Mongodump/MongoRestore
  • mongoexport/mongoimport é o melhor par de ferramentas de migração para migrar um subconjunto do seu banco de dados MongoDB.
    • mongoexport exporta seus dados existentes para um arquivo JSON ou CSV legível por humanos. Mongoexport usa um argumento especificando o subconjunto de seus dados existentes para exportar.
    • mongoimport abre um arquivo JSON ou CSV e insere o conteúdo na instância do banco de dados de destino (neste caso, o Azure Cosmos DB para MongoDB baseado em vCore).
    • JSON e CSV não são um formato compacto; você pode incorrer em cobranças de rede excessivas, pois o mongoimport envia dados para o Azure Cosmos DB para MongoDB baseado em vCore.
  • mongodump/mongorestore é o melhor par de ferramentas de migração para migrar todo o seu banco de dados MongoDB. O formato BSON compacto faz uso mais eficiente dos recursos de rede à medida que os dados são inseridos no Azure Cosmos DB para MongoDB baseado em vCore.
    • mongodump exporta seus dados existentes como um arquivo BSON.
    • mongorestore importa seu despejo de arquivo BSON para o Azure Cosmos DB baseado em vCore para MongoDB.

Nota

As ferramentas nativas do MongoDB podem mover dados apenas com a velocidade permitida pelo hardware do host.

Migração de dados usando o Azure Databricks (Offline/Online)

A migração usando o Azure Databricks oferece controle total da taxa de migração e da transformação de dados. Esse método também pode oferecer suporte a grandes conjuntos de dados que estão em TBs de tamanho. O utilitário de migração de faísca opera como um trabalho dentro do Databricks.

Esta ferramenta suporta as seguintes fontes do MongoDB:

  • MongoDB VM
  • MongoDB Atlas
  • Banco de dados de documentos da AWS
  • Azure Cosmos DB MongoDB RU (somente offline)

Inscreva-se no Azure Cosmos DB for MongoDB Spark Migration para obter acesso ao repositório GitHub da Ferramenta de Migração do Spark. O repositório oferece instruções detalhadas e passo a passo para migrar suas cargas de trabalho de várias fontes Mongo para o Azure Cosmos DB para MongoDB baseado em vCore.

  • Migre dados para o Azure Cosmos DB para MongoDB baseado em vCore usando ferramentas nativas do MongoDB.
  • Migre dados para o Azure Cosmos DB para MongoDB baseado em vCore usando a extensão de migração do MongoDB para o Azure Data Studio.