Welche Optionen zum Migrieren von Daten von MongoDB zu V-Kern-basiertem Azure Cosmos DB for MongoDB gibt es?

In diesem Dokument werden die verschiedenen Optionen beschrieben, mit denen Sie Ihre MongoDB-Workloads mit Lift und Shift zum V-Kern-basierten Azure Cosmos DB for MongoDB-Angebot verschieben können.

Migrationen können auf zwei Arten durchgeführt werden:

  • Offlinemigration: Eine auf einer Schattenkopie basierende Massenkopie von Quelle zu Ziel. Neue Daten, die nach dem Erstellen der Schattenkopie in der Quelle hinzugefügt/aktualisiert/gelöscht wurden, werden nicht in das Ziel kopiert. Die erforderliche Downtime der Anwendung hängt von der Zeit ab, die für den Abschluss der Massenkopieraktivität benötigt wird.

  • Onlinemigration: Abgesehen von der Massenkopieraktivität für Daten, die in der Offlinemigration durchgeführt wurde, überwacht ein Änderungsdatenstrom alle Ergänzungen/Aktualisierungen/Löschungen. Nachdem die Massendatenkopie abgeschlossen wurde, werden die Daten im Änderungsdatenstrom in das Ziel kopiert, um sicherzustellen, dass alle während des Migrationsprozesses vorgenommenen Aktualisierungen ebenfalls an das Ziel übertragen werden. Die erforderliche Downtime der Anwendung ist minimal.

Azure Data Studio (Online)

Die MongoDB-Migrationserweiterung für Azure Data Studio ist das bevorzugte Tool zum Migrieren Ihrer MongoDB-Workloads zur V-Kern-basierten Azure Cosmos DB for MongoDB.

Der Migrationsprozess hat zwei Phasen:

  • Bewertung der Vormigration – Eine Auswertung Ihres aktuellen MongoDB-Datenbestands, um zu ermitteln, ob es Inkompatibilitäten gibt.
  • Migration – Der Migrationsvorgang unter Verwendung von von Azure verwalteten Diensten.

Bewertung vor der Migration

Die Bewertung umfasst die Ermittlung, ob Sie die Features und die Syntax verwenden, die unterstützt werden. Zweck dieser Phase ist es, Inkompatibilitäten oder Warnungen zu identifizieren, die in der aktuellen MongoDB-Lösung vorhanden sind. Sie sollten die in den Bewertungsergebnissen gefundenen Probleme beheben, bevor Sie mit dem Migrationsprozess fortfahren.

Tipp

Wir empfehlen Ihnen, die unterstützten Funktionen und die Syntax im Detail durchzugehen und vor der eigentlichen Migration einen Proof of Concept durchzuführen.

Migration

Verwenden Sie die grafische Benutzeroberfläche, um den gesamten Migrationsprozess von Anfang bis Ende zu verwalten. Die Migration wird in Azure Data Studio gestartet, wird aber in der Cloud auf von Azure verwalteten Ressourcen ausgeführt.

Native MongoDB-Tools (offline)

Sie können die nativen MongoDB-Tools wie mongodump/mongorestore oder mongoexport/mongoimport verwenden, um Datasets offline (ohne Replikation der Live-Änderungen) zum V-Kern-basierten Azure Cosmos DB for MongoDB-Angebot zu migrieren.

Szenario Natives MongoDB-Tool
Verschieben einer Teilmenge von Datenbankdaten (JSON- oder CSV-basiert) mongoexport/mongoimport
Verschieben der gesamten Datenbank (BSON-basiert) mongodump/mongorestore
  • mongoexport/mongoimport ist die beste Kombination von Migrationstools, wenn Sie eine Teilmenge Ihrer MongoDB-Datenbank migrieren möchten.
    • Mit mongoexport können Sie Ihre vorhandenen Daten in eine lesbare JSON- oder CSV-Datei exportieren. Von mongoexport wird ein Argument zur Angabe der zu exportierenden Teilmenge Ihrer vorhandenen Daten akzeptiert.
    • mongoimport öffnet eine JSON- oder CSV-Datei und fügt den Inhalt in die Zieldatenbankinstanz (in diesem Fall: V-Kern-basierte Azure Cosmos DB for MongoDB) ein.
    • JSON und CSV sind keine kompakten Formate. Es könnten zusätzliche Netzwerkgebühren anfallen, da mongoimport Daten an das V-Kern-basierte Azure Cosmos DB for MongoDB sendet.
  • mongodump/mongorestore ist die beste Kombination von Migrationstools, wenn Sie Ihre gesamte MongoDB-Datenbank migrieren möchten. Das kompakte BSON-Format ermöglicht eine effizientere Nutzung der Netzwerkressourcen, da die Daten in das V-Kern-basierte Azure Cosmos DB for MongoDB eingefügt werden.
    • Von mongodump werden Ihre vorhandenen Daten als BSON-Datei exportiert.
    • mongorestore importiert Ihre BSON-Dateisicherungskopie in das V-Kern-basierte Azure Cosmos DB for MongoDB.

Hinweis

Die nativen MongoDB-Tools können Daten nur so schnell verschieben, wie es die Hosthardware zulässt.

Datenmigration unter Verwendung von Azure Databricks (offline/online)

Die Migration mithilfe von Azure Databricks bietet vollständige Kontrolle über die Migrationsrate und die Datentransformation. Die Methode kann auch große Datasets unterstützen, die sich im Größenbereich von TBs bewegen. Das Spark-Migrationshilfsprogramm fungiert als ein Auftrag in Databricks.

Dieses Tool unterstützt die folgenden MongoDB-Quellen:

  • MongoDB-VM
  • MongoDB Atlas
  • AWS-DocumentDB
  • Azure Cosmos DB MongoDB RU (nur Offline)

Registrieren Sie sich für die Spark-Migration von Azure Cosmos DB for MongoDB, um Zugriff auf das GitHub-Repository des Spark Migrationstools zu erhalten. Das Repository bietet detaillierte, schrittweise Anleitungen zum Migrieren Ihrer Workloads aus verschiedenen Mongo-Quellen zu V-Kern-basiertem Azure Cosmos DB for MongoDB.