Häufig gestellte Fragen in PolyBase

Gilt für: SQL Server 2016 (13.x) und höhere Versionen

PolyBase vs. Verbindungsserver

In der folgenden Tabelle werden die Unterschiede zwischen PolyBase und Verbindungsserverfunktionen hervorgehoben:

PolyBase Verbindungsserver
Datenbankweites Objekt Instanzweites Objekt
Verwendet ODBC-Treiber. Verwendet OLEDB-Anbieter.
Unterstützt schreibgeschützte Vorgänge für alle Datenquellen und das Schreiben in einige externe Datenquellen Unterstützt sowohl Lese- als auch Schreibvorgänge
Abfragen einer Remotedatenquelle über eine einzige Verbindung lassen sich horizontal skalieren Abfragen einer Remotedatenquelle über eine einzige Verbindung lassen sich nicht horizontal skalieren
Weitergabe von Prädikaten wird unterstützt Weitergabe von Prädikaten wird unterstützt
Es ist keine separate Konfiguration für die Verfügbarkeitsgruppe erforderlich Es ist eine separate Konfiguration für jede Instanz in der Verfügbarkeitsgruppe erforderlich
Nur Standardauthentifizierung Standard- und integrierte Authentifizierung
Geeignet für Analyseabfragen, die eine große Anzahl von Zeilen verarbeiten Geeignet für OLTP-Abfragen, die einzelne oder wenige Zeilen zurückgeben
Abfragen, die externe Tabellen verwenden, können nicht an der verteilten Transaktion teilnehmen Verteilte Abfragen können an verteilter Transaktion teilnehmen

Neuigkeiten bei PolyBase in SQL Server 2022?

SQL Server 2022 (16.x) unterstützt jetzt CSV-, Parquet- und Delta-Dateien, die in Azure Speicherkonto v2, Azure Data Lake Storage Gen2 oder einem beliebigen S3-kompatiblen Objektspeicher unter Verwendung der S3-REST-API gespeichert sind, lokal oder in der Cloud.

SQL Server 2022 (16.x) kann nun CREATE EXTERNAL TABLE als SELECT (CETAS) verwenden, zusammen mit Befehlen wie OPENROWSET, CREATE EXTERNAL TABLE (CET) und allen neuen T-SQL-Erweiterungen.

Derzeit wurde die Unterstützung für externe Hadoop-Datenquellen in SQL Server 2022 (16.x) entfernt.

Das kumulative Update 2 für SQL Server 2022 (16.x) bietet jetzt Unterstützung für Oracle TNS-Dateien. Weitere Informationen und Beispiele finden Sie unter CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS.

Weitere Informationen zur Datenvirtualisierung mit PolyBase für SQL Server 2022 und zu SQL Server 2022 PolyBase-Verbesserungen.

Neuigkeiten bei PolyBase in SQL Server 2019?

PolyBase in SQL Server 2019 (15.x) kann ab sofort Daten aus vielen verschiedenen Datenquellen lesen. Die Daten aus diesen externen Datenquellen können als externe Tabellen auf Ihrer SQL Server-Instanz gespeichert werden. Zudem unterstützt PolyBase die Weitergabeberechnung für diese externen Datenquellen, mit Ausnahme von generischen ODBC-Typen.

Kompatible Datenquellen

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Kompatible generische ODBC-Typen

Das kumulative Update 19 für SQL Server 2019 (15.x) bietet jetzt Unterstützung für Oracle TNS-Dateien. Weitere Informationen und Beispiele finden Sie unter CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS.

Hinweis

Mit PolyBase sind jetzt Verbindungen zu externen Datenquellen über ODBC-Treiber von Drittanbietern möglich. Diese Treiber sind nicht im Lieferumfang von PolyBase enthalten und funktionieren ggf. nicht wie vorgesehen. Weitere Informationen finden Sie unter Konfigurieren von PolyBase für den Zugriff auf externe Daten mit generischen ODBC-Typen.

Welche CONNECTION_OPTIONS kann ich für die Verbindung mit Datenquellen von Drittanbietern angeben?

Überprüfen Sie CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS für unterstützte Datenanbieterverbindungsoptionen für SQL Server, Oracle, Teradata, die MongoDB-API für Cosmos DB und generische ODBC-Datenanbieter.

Wie kann ich den Ausführungsplan für Remoteabfragen der PolyBase-Pushdownberechnung anzeigen?

Hierfür gibt es verschiedene Methoden, die von der SQL Server-Version abhängen. Informationen finden Sie unter Überwachung und Problembehandlung für PolyBase – So zeigen Sie den PolyBase-Abfrageplan an (Änderung vorbehalten).

Wie kann ich feststellen, ob die PolyBase-Pushdownberechnung ausgeführt wird?

Informationen finden Sie unter Identifizieren eines externen Pushdowns.

Wird PolyBase in Azure SQL-Datenbank unterstützt?

Nein, aber Sie können Daten in den auf Azure Blob Storage abgelegten Dateien mit der Funktion OPENROWSET abfragen oder CREATE EXTERNAL TABLE verwenden, um aus einem serverlosen SQL-Pool in Synapse Analytics zu lesen. Weitere Informationen finden Sie unter Azure SQL kann Azure Data Lake Storage-Dateien mit externen Synapse SQL-Tabellen lesen.

Wird PolyBase auf Azure SQL Managed Instance unterstützt?

Azure SQL Managed Instance verfügt über eigene Datenvirtualisierungsfunktionen für Azure Data Lake Storage (ADLS) und Azure Blob Storage als Datenquellen. Weitere Informationen finden Sie unter Datenvirtualisierung mit Azure SQL Managed Instance.

Welche Ports meiner Firewall sollte ich für PolyBase zulassen?

Für PolyBase selbst müssen keine zusätzlichen Ports geöffnet werden, außer im Fall einer PolyBase-Erweiterungsgruppe. Ohne eine Erweiterungsgruppe sollte der PolyBase-Dienst allein keine Firewallregel erfordern.

Auf Windows-Servern nutzt PolyBase die von SQL Server im Abschnitt IPAll der TCP/IP-Einstellungen im SQL Server-Konfigurations-Manager verwendeten Ports. Weitere Informationen finden Sie unter TCP/IP-Eigenschaften. Auf Linux-Servern nutzt PolyBase die Einstellung network.tcpport. Weitere Informationen finden Sie unter TCP-Port.

Informationen zu PolyBase-Erweiterungsgruppen über mehrere Windows-Server finden Sie unter „Portinformationen“ in der nächsten Frage.

Sie müssen jedoch andere Ports für die Kommunikation mit den verschiedenen externen Datenquellen zulassen, die von PolyBase verwendet werden. Lesen Sie die Dokumentation zu ODBC-Konfiguration, Azure-Ressourcenkonfiguration oder bestimmten Datenquellen. Zum Beispiel:

Quellplattform Verweis
Microsoft SQL Server Von SQL Server verwendete Ports
Hortonworks HDP Verwalten von HDFS
Cloudera CDH Von CDH-Komponenten verwendete Ports

Welche Ports werden für die PolyBase-Erweiterungsgruppe verwendet?

Standardmäßig stellt der PolyBase-Datenverschiebungsdienst über einen Portbereich von TCP 16450-16460 eine Verbindung mit dem Hauptknoten einer Erweiterungsgruppe her, wobei normalerweise die Ports 16450-16453 und 17001 verwendet werden. Diese Ports werden nur verwendet, wenn eine PolyBase-Erweiterungsgruppe konfiguriert wurde und über Serverfirewalls zugelassen werden soll. Beim Einrichten von SQL Server sollte automatisch eine lokale Firewallregel erstellt werden, die diese Ports bei der Feature-Installation zulässt. Weitere Informationen finden Sie unter Konfigurieren von PolyBase-Erweiterungsgruppen unter Windows.

Hinweis

Die Microsoft SQL Server PolyBase-Erweiterungsgruppen werden eingestellt. Die Erweiterungsgruppen-Funktionalität wird in SQL Server 2022 (16.x) aus dem Produkt entfernt.

PolyBase in Big Data-Clustern vs. PolyBase in eigenständigen Instances

Weitere Informationen zu Verbindungen mit dem generischen ODBC-Connector finden Sie in unserer Anleitung zum Konfigurieren von generischen ODBC-Datentypen.

Die folgende Tabelle hebt die PolyBase-Funktionen hervor, die in SQL Server 2019 (15.x) als eigenständige Installation und SQL Server 2019 (15.x) Big Data-Cluster verfügbar sind:

Funktion Big Data-Cluster Eigenständige Instanz
Erstellen einer externen Datenquelle für SQL Server, Oracle, Teradata und Mongo DB X X
Erstellen einer externe Datenquelle mit einem kompatiblen ODBC-Treibers eines Drittanbieters X
Erstellen einer externen Datenquelle für Hadoop-Datenquelle X X
Erstellen einer externen Datenquelle für Azure Blob Storage X X
Erstellen einer externen Tabelle für einen SQL Server-Datenpool X
Erstellen einer externen Tabelle für einen SQL Server-Speicherpool X
Horizontale Skalierung der Abfrageausführung X X (nur Windows)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.