Erste Schritte mit Azure Synapse Link für SQL Server 2022

Dieser Artikel enthält eine schrittweise Anleitung für den Einstieg in Azure Synapse Link für SQL Server 2022. Eine Übersicht finden Sie unter Azure Synapse Link für SQL Server 2022.

Voraussetzungen

  • Lesen Sie zuerst den Artikel Erstellen eines neuen Synapse-Arbeitsbereichs, um Azure Synapse Link für SQL abzurufen. Im aktuellen Tutorial wird Azure Synapse Link für SQL in einem öffentlichen Netzwerk erstellt. In diesem Artikel wird davon ausgegangen, dass Sie beim Erstellen eines Azure Synapse-Arbeitsbereichs die Optionen Verwaltetes virtuelles Netzwerk deaktivieren und Verbindungen von allen IP-Adressen zulassen ausgewählt haben. Wenn Sie Azure Synapse Link für SQL Server 2022 mit Netzwerksicherheit konfigurieren möchten, finden Sie entsprechende Informationen unter Konfigurieren von Azure Synapse Link für SQL Server 2022 mit Netzwerksicherheit.

  • Erstellen Sie ein Azure Data Lake Storage Gen2-Konto, das sich von dem Konto unterscheidet, das Sie mit dem Azure Synapse Analytics-Arbeitsbereich erstellt haben. Sie verwenden dieses Konto als Zielzone, um die von SQL Server 2022 übermittelten Daten bereitzustellen. Weitere Informationen finden Sie unter Erstellen eines Azure Data Lake Storage Gen2-Kontos.

  • Stellen Sie sicher, dass für Ihre SQL Server 2022-Datenbank ein Masterschlüssel erstellt wurde.

    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<a new password>'
    

Erstellen Ihres dedizierten Azure Synapse SQL-Zielpools

  1. Öffnen Sie Synapse Studio.

  2. Öffnen Sie den Hub Verwalten, wechseln Sie zu SQL-Pools, und wählen Sie Neu aus.

    Screenshot: Erstellen eines neuen dedizierten Azure Synapse SQL-Pools aus Synapse Studio.

  3. Geben Sie einen eindeutigen Poolnamen ein, verwenden Sie die Standardeinstellungen, und erstellen Sie den dedizierten Pool.

  4. Im Hub Daten sollte unter Arbeitsbereich und Datenbanken Ihre neue Azure Synapse SQL-Datenbank aufgeführt werden. Wählen Sie in Ihrer neuen Azure Synapse SQL-Datenbank Neues SQL-Skript und dann Leeres Skript aus.

    Screenshot: Erstellen eines leeren SQL-Skripts aus Synapse Studio.

  5. Um den Masterschlüssel für Ihre Azure Synapse SQL-Zieldatenbank zu erstellen, fügen Sie das folgende Skript ein, und wählen Sie dann Ausführen aus.

    CREATE MASTER KEY
    

Erstellen eines verknüpften Diensts für Ihre SQL Server 2022-Datenbank

  1. Wählen Sie den Hub Verwalten und dann Verknüpfte Dienste aus.

    Navigieren zu „Verknüpfte Dienste“ aus Synapse Studio.

  2. Drücken Sie Neu, und wählen Sie SQL Server und dann Weiter aus.

    Screenshot: Erstellen eines verknüpften SQL Server-Diensts.

  3. Geben Sie im Feld Name den Namen des verknüpften SQL Server 2022-Diensts ein.

    Screenshot: Eingabe von Server- und Datenbanknamen für die Verbindung.

    Hinweis

    Nur der verknüpfte Dienst in der Legacyversion wird unterstützt.

  4. Bei Auswahl der „Integration Runtime“ sollten Sie Ihre selbstgehostete Integration Runtime auswählen. Wenn Ihr Azure Synapse-Arbeitsbereich keine selbstgehostete Integration Runtime enthält, müssen Sie eine erstellen.

  5. (Optional) Um eine selbstgehostete Integration Runtime für die Verbindung mit Ihrer SQL Server 2022-Quellinstanz zu erstellen, gehen Sie wie folgt vor:

    a. Wählen Sie Neuaus.

    Screenshot: Erstellen einer neuen selbstgehosteten Integration Runtime.

    b. Wählen Sie Selbstgehostet und dann Weiter aus.

    c. Geben Sie im Feld Name den Namen der selbstgehosteten Integration Runtime ein, und wählen Sie dann Erstellen aus.

    Screenshot: Eingeben eines Namens für die selbstgehostete Integration Runtime.

    Jetzt ist eine selbstgehostete Integration Runtime in Ihrem Azure Synapse-Arbeitsbereich verfügbar.

    d. Folgen Sie den Anweisungen, um den Integration Runtime-Agent auf den Windows-Computer mit Direktzugriff auf Ihre SQL Server 2022-Instanz herunterzuladen, ihn dann zu installieren und anhand des Schlüssels zu registrieren. Weitere Informationen finden Sie unter Erstellen einer selbstgehosteten Integration Runtime – Azure Data Factory und Azure Synapse .

    Screenshot: Herunterladen, Installieren und Registrieren der Integration Runtime.

    e. Klicken Sie auf Schließen.

    Abrufen des Status der Integration Runtime

    f. Wechseln Sie zur Überwachungsseite, und stellen Sie sicher, dass Ihre selbstgehostete Integration Runtime ausgeführt wird. Wählen Sie dazu Aktualisieren aus, um den aktuellen Status der Integration Runtime abzurufen.

  6. Fahren Sie mit der Eingabe der übrigen Informationen für Ihren verknüpften Dienst fort: SQL Server-Name, Datenbankname, Authentifizierungstyp, Benutzername und Kennwort, um eine Verbindung mit Ihrer SQL Server 2022-Instanz herzustellen.

    Hinweis

    Es wird empfohlen, die Verschlüsselung für diese Verbindung zu aktivieren. Fügen Sie dazu die Eigenschaft Encrypt mit dem Wert true als zusätzliche Verbindungseigenschaft hinzu. Legen Sie auch je nach Serverkonfiguration die Eigenschaft Trust Server Certificate entweder auf true oder false fest. Weitere Informationen finden Sie unter Aktivieren von verschlüsselten Verbindungen zur Datenbank-Engine.

  7. Wählen Sie Verbindung testen aus, um sicherzustellen, dass Ihre selbstgehostete Integration Runtime auf Ihre SQL Server-Instanz zugreifen kann.

  8. Klicken Sie auf Erstellen.

    Ihr neuer verknüpfter Dienst wird mit der SQL Server 2022-Instanz verbunden, die in Ihrem Arbeitsbereich verfügbar ist.

    Screenshot: Anzeigen der Verbindung zum verknüpften Dienst.

    Hinweis

    Der hier von Ihnen erstellte verknüpfte Dienst ist nicht speziell für Azure Synapse Link für SQL bestimmt. Er kann von jedem Benutzer des Arbeitsbereichs verwendet werden, der über die entsprechenden Berechtigungen verfügt. Nehmen Sie sich Zeit, sich über den Kreis der Benutzer klar zu werden, die Zugriff auf diesen verknüpften Dienst und seine Anmeldeinformationen erhalten sollten. Weitere Informationen zu Berechtigungen in Azure Synapse-Arbeitsbereichen finden Sie unter Übersicht über die Zugriffssteuerung für Azure Synapse-Arbeitsbereiche – Azure Synapse Analytics.

Erstellen eines verknüpften Diensts zum Herstellen einer Verbindung mit Ihrer Zielzone in Azure Data Lake Storage Gen2

  1. Wechseln Sie zu Ihrem neu erstellten Azure Data Lake Storage Gen2-Konto, wählen Sie Zugriffssteuerung (IAM) und Hinzufügen aus. Wählen Sie dann Rollenzuweisung hinzufügen aus.

    Screenshot: Bereich „Zugriffssteuerung (IAM)

  2. Wählen Sie für die ausgewählte Rolle Mitwirkender an Storage-Blobdaten aus, wählen Sie Verwaltete Identität und dann unter Mitglieder Ihren Azure Synapse-Arbeitsbereich aus. Das Hinzufügen dieser Rollenzuweisung kann einige Minuten dauern.

    Screenshot: Hinzufügen einer Rollenzuweisung.

    Hinweis

    Stellen Sie sicher, dass Sie die Berechtigungen für verwaltete Identitäten in Ihrem Azure Synapse-Arbeitsbereich auch dem Azure Data Lake Storage Gen2-Speicherkonto erteilt haben, das als Zielzone verwendet wird. Weitere Informationen finden Sie unter Erteilen von Berechtigungen für verwaltete Identitäten im Azure Synapse-Arbeitsbereich – Azure Synapse Analytics.

  3. Öffnen Sie den Hub Verwalten in Ihrem Azure Synapse-Arbeitsbereich, und wechseln Sie zu Verknüpfte Dienste.

    Screenshot: Wechseln zum verknüpften Dienst.

  4. Wählen Sie Neu und dann Azure Data Lake Storage Gen2 aus.

  5. Gehen Sie folgendermaßen vor:

    a. Geben Sie im Feld Name den Namen des verknüpften Diensts für Ihre Zielzone ein.

    b. Geben Sie Verwaltete Identität als Authentifizierungsmethode ein.

    c. Wählen Sie den Namen des Speicherkontos aus, das bereits erstellt wurde.

  6. Wählen Sie Verbindung testen aus, um sicherzustellen, dass Sie Zugriff auf Ihr Azure Data Lake Storage Gen2-Konto haben.

  7. Klicken Sie auf Erstellen.

    Ihr neuer verknüpfter Dienst wird mit dem Azure Data Lake Storage Gen2-Konto verbunden.

    Screenshot: Neuer verknüpfter Dienst für Azure Data Lake Storage Gen2.

    Hinweis

    Der hier von Ihnen erstellte verknüpfte Dienst ist nicht speziell für Azure Synapse Link für SQL bestimmt. Er kann von jedem Benutzer des Arbeitsbereichs verwendet werden, der über die entsprechenden Berechtigungen verfügt. Nehmen Sie sich Zeit, sich über den Kreis der Benutzer klar zu werden, die Zugriff auf diesen verknüpften Dienst und seine Anmeldeinformationen erhalten sollten. Weitere Informationen zu Berechtigungen in Azure Synapse-Arbeitsbereichen finden Sie unter Übersicht über die Zugriffssteuerung für Azure Synapse-Arbeitsbereiche – Azure Synapse Analytics.

  1. Öffnen Sie von Synapse Studio den Hub Integrieren.

  2. Wählen Sie im Bereich Integrieren das Pluszeichen (+) aus, und wählen Sie dann Linkverbindung aus.

    Screenshot der Schaltfläche „Linkverbindung“.

  3. Geben Sie Ihre Quelldatenbank ein:

    a. Wählen Sie SQL Server als Quelltyp aus.

    b, Wählen Sie als Quelle für Ihren verknüpften Dienst den Dienst aus, der eine Verbindung mit Ihrer SQL Server 2022-Instanz herstellt.

    c. Wählen Sie als Tabellennamen Namen aus Ihrer SQL Server-Instanz aus, die in Ihren Azure Synapse SQL-Pool repliziert werden soll.

    d. Wählen Sie Weiter.

    Screenshot, Eingeben der Quelldatenbankdetails.

  4. Wählen Sie aus den dedizierten Synapse SQL-Pools einen Zieldatenbanknamen aus.

  5. Wählen Sie Weiter.

  6. Geben Sie Ihre Link-Verbindungseinstellungen ein:

    a. Geben Sie unter Name für die Link-Verbindung den Namen ein.

    b. Geben Sie unter Anzahl Kerne für die Berechnung der Link-Verbindung die Anzahl der Kerne ein. Diese Kerne werden für die Verschiebung von Daten aus der Quelle in das Ziel verwendet. Wir empfehlen, mit einer kleinen Zahl zu beginnen und bei Bedarf die Anzahl zu erhöhen.

    c. Wählen Sie als Verknüpfter Dienst den Dienst aus, der eine Verbindung mit Ihrer Zielzone herstellt.

    d. Geben Sie Ihren Azure Data Lake Storage Gen2-Containernamen oder -Container-/Ordnernamen als Pfad zum Zielzonenordner zum Bereitstellen der Daten ein. Der Container muss zuerst erstellt werden.

    e. Geben Sie Ihr Azure Data Lake Storage Gen2-SAS-Token (Shared Access Signature) ein. Das Token ist erforderlich, damit der SQL-Änderungsfeed Zugriff auf die Zielzone erhält. Wenn Ihr Azure Data Lake Storage Gen2-Konto über kein SAS-Token verfügt, können Sie ein solches Token erstellen, indem Sie Token generieren auswählen.

    f. Klicken Sie auf OK.

    Screenshot: Eingeben der Link-Verbindungseinstellungen.

    Hinweis

    Die Anzahl der hier ausgewählten Kerne wird dem Datenerfassungsdienst zur Verarbeitung von Datenladevorgängen und Datenänderungen zugeordnet. Sie wirken sich nicht auf die Konfiguration des dedizierten SQL-Zielpools aus. Wenn Sie aufgrund von Einschränkungen aus Ihrem Speicher keine Verbindung mit der Zielzone herstellen können, indem Sie generiertes SAS-Token verwenden, können Sie auch versuchen, das SAS-Token für Delegierung zu verwenden, um eine Verbindung mit der Zielzone herzustellen.

  7. Wenn die neue Azure Synapse Link-Verbindung geöffnet ist, können Sie den Namen der Zieltabelle, den Verteilungstyp und den Strukturtyp aktualisieren.

    Hinweis

    • Ziehen Sie als Strukturtyp eine Heaptabelle in Betracht, wenn Ihre Daten die Datentypen „varchar(max)“, „nvarchar(max)“ und „varbinary(max)“ enthalten.
    • Stellen Sie sicher, dass das Schema in Ihrem dedizierten Azure Synapse SQL-Pool bereits erstellt ist, bevor Sie die Link-Verbindung starten. Azure Synapse Link für SQL erstellt Tabellen automatisch unter Ihrem Schema im Azure Synapse SQL-Pool.
  8. Wählen Sie in der Dropdownliste Aktion für vorhandene Zieltabelle die Option aus, die für Ihr Szenario am besten geeignet ist, wenn die Tabelle bereits im Ziel vorhanden ist.

    • Tabelle löschen und neu erstellen: Die vorhandene Zieltabelle wird gelöscht und neu erstellt.
    • Fehler bei nicht leeren Tabellen: Wenn die Zieltabelle Daten enthält, schlägt die Verknüpfungsverbindung für die angegebene Tabelle fehl.
    • Mit vorhandenen Daten zusammenführen: Die Daten werden in der vorhandenen Tabelle zusammengeführt.

    Hinweis

    Wenn Sie mehrere Quellen mit demselben Ziel zusammenführen möchten, indem Sie „Mit vorhandenen Daten zusammenführen“ auswählen, stellen Sie sicher, dass die Quellen unterschiedliche Daten enthalten, um Konflikte und unerwartete Ergebnisse zu vermeiden.

  9. Geben Sie an, ob die Transaktionskonsistenz in Tabellen aktiviert werden soll.

    • Wenn diese Option aktiviert ist, wird eine Transaktion, die sich über mehrere Tabellen in der Quelldatenbank erstreckt, immer in die Zieldatenbank in einer einzelnen Transaktion repliziert. Dies führt jedoch zu Mehraufwand für den Gesamtreplikationsdurchsatz.
    • Wenn die Option deaktiviert ist, repliziert jede Tabelle Änderungen in ihrer eigenen Transaktionsgrenze an das Ziel in parallelen Verbindungen, wodurch der Gesamtreplikationsdurchsatz verbessert wird.

    Hinweis

    Wenn Sie die Transaktionskonsistenz in Tabellen aktivieren möchten, stellen Sie auch sicher, dass die Transaktionsisolationsstufen im dedizierten SQL-Pool von Synapse READ COMMIT SNAPSHOT ISOLATION sind.

  10. Wählen Sie Alle veröffentlichen aus, um die neue Link-Verbindung mit dem Dienst zu speichern.

Wählen Sie Starten aus, und warten Sie dann einige Minuten, bis die Daten repliziert wurden.

Hinweis

Eine Link-Verbindung beginnt mit einem ersten vollständigen Ladevorgang aus Ihrer Quelldatenbank. Daran schließen sich inkrementelle Änderungsfeeds über die Änderungsfeedfunktion in SQL Server 2022 an. Weitere Informationen finden Sie unter Änderungsfeed von Azure Synapse Link für SQL.

Sie können den Status Ihrer Azure Synapse Link-Verbindung überwachen, anzeigen, welche Tabellen anfänglich kopiert werden (über Momentaufnahmen), und erkennen, welche Tabellen sich im Modus „Fortlaufende Replikation“ befinden (werden repliziert).

  1. Wechseln Sie zum Monitorhub Ihres Azure Synapse Arbeitsbereichs, und wählen Sie dann Link-Verbindungen aus.

  2. Öffnen Sie die Link-Verbindung, die Sie gestartet haben, und zeigen Sie den Status der einzelnen Tabellen an.

  3. Wählen Sie Aktualisieren in der Überwachungsansicht für Ihre Verbindung aus, um mögliche Aktualisierungen des Status zu beobachten.

    Überwachen der verknüpften Verbindung

Abfragen replizierter Daten

Warten Sie einige Minuten, und überprüfen Sie dann, ob die Zieldatenbank die erwartete Tabelle und die erwarteten Daten enthält. Sehen Sie sich die Daten an, die im Zielspeicher Ihres dedizierten Azure Synapse SQL-Pools verfügbar sind. Sie können nun auch die replizierten Tabellen in Ihrem dedizierten Azure Synapse SQL-Zielpool untersuchen.

  1. Öffnen Sie im Hub Daten unter Arbeitsbereich Ihre Zieldatenbank.

  2. Klicken Sie unter Tabellen mit der rechten Maustaste auf eine Ihrer Zieltabellen.

  3. Wählen Sie Neues SQL-Skript aus, und wählen Sie dann Erste 100 Zeilen aus.

  4. Führen Sie diese Abfrage aus, um die replizierten Daten in Ihrem dedizierten Azure Synapse SQL-Zielpool anzuzeigen.

  5. Sie können die Zieldatenbank auch mithilfe von Microsoft SQL Server Management Studio (SSMS) oder anderen Tools abfragen. Verwenden Sie den dedizierten SQL-Endpunkt für Ihren Arbeitsbereich als Servernamen. Der Name lautet normalerweise <workspacename>.sql.azuresynapse.net. Fügen Sie Database=databasename@poolname als weiteren Parameter für die Verbindungszeichenfolge hinzu, wenn Sie eine Verbindung über SSMS oder andere Tools herstellen.

Gehen Sie wie folgt vor, um Tabellen in Synapse Studio hinzuzufügen oder zu entfernen:

  1. Öffnen Sie in Ihrem Azure Synapse-Arbeitsbereich den Hub Integrieren.

  2. Wählen Sie die zu bearbeitende Link-Verbindung aus, und öffnen Sie sie.

  3. Führen Sie einen der folgenden Schritte aus:

    • Um eine Tabelle hinzuzufügen, wählen Sie Neue Tabelle aus.
    • Um eine Tabelle zu entfernen, wählen Sie das Papierkorbsymbol neben der jeweiligen Tabelle aus.

    Screenshot: Bereich der Link-Verbindung zum Hinzufügen oder Entfernen von Tabellen.

    Hinweis

    Sie können Tabellen direkt hinzufügen oder entfernen, wenn eine Link-Verbindung ausgeführt wird.

Gehen Sie wie folgt vor, um die Azure Synapse Link-Verbindung in Synapse Studio zu beenden:

  1. Öffnen Sie in Ihrem Azure Synapse-Arbeitsbereich den Hub Integrieren.

  2. Wählen Sie die zu bearbeitende Link-Verbindung aus, und öffnen Sie sie.

  3. Wählen Sie Beenden aus, um die Link-Verbindung zu beenden. Die Replikation Ihrer Daten wird dann beendet.

    Screenshot: Bereich zum Beenden einer Link-Verbindung.

    Hinweis

    • Wenn Sie eine Link-Verbindung nach dem Beenden neu starten, beginnt sie mit einem vollständigen ersten Ladevorgang aus Ihrer Quelldatenbank, gefolgt von inkrementellen Änderungsfeeds.
    • Wenn Sie Mit vorhandenen Daten zusammenführen als Aktion für die vorhandene Zieltabelle auswählen und die Verknüpfungsverbindung beenden und neu starten, werden die in diesem Zeitraum in der Quelle gelöschten Datensätze nicht im Ziel gelöscht. Wenn Sie in einem solchen Fall die Datenkonsistenz sicherstellen möchten, ziehen Sie in Betracht, „pause/resume“ anstelle von „stop/start“ zu verwenden oder die Zieltabellen zu bereinigen, bevor Sie die Verknüpfungsverbindung neu starten.

Rotieren des SAS-Tokens für die Zielzone

Ein SAS-Token (Shared Access Signature) ist für den SQL-Änderungsfeed erforderlich, damit er Zugriff auf die Zielzone erhält und Daten per Push dorthin übertragen kann. Das SAS-Token hat ein Ablaufdatum, sodass Sie es vor diesem Datum rotieren müssen. Andernfalls kann Azure Synapse Link die Daten nicht aus der SQL Server-Instanz in den dedizierten Azure Synapse SQL-Pool replizieren.

  1. Öffnen Sie in Ihrem Azure Synapse-Arbeitsbereich den Hub Integrieren.

  2. Wählen Sie die zu bearbeitende Link-Verbindung aus, und öffnen Sie sie.

  3. Wählen Sie Token rotieren aus.

    Screenshot: Rotieren eines SAS-Tokens.

  4. Um das neue SAS-Token abzurufen, wählen Sie Automatisch generieren oder Manuell eingeben und dann OK aus.

    Screenshot: Abrufen eines neuen SAS-Tokens.

    Hinweis

    Wenn Sie aufgrund von Einschränkungen aus Ihrem Speicher keine Verbindung mit der Zielzone herstellen können, indem Sie generiertes SAS-Token verwenden, können Sie auch versuchen, das SAS-Token für Delegierung zu verwenden, um eine Verbindung mit der Zielzone herzustellen.

Nächste Schritte

Wenn Sie eine andere Datenbank als SQL Server 2022 verwenden, lesen Sie: