Was ist neu in HDInsight auf AKS? (Vorschau)

Artikel
10/16/2024

Hinweis

Azure HDInsight on AKS wird am 31. Januar 2025 eingestellt. Vor dem 31. Januar 2025 müssen Sie Ihre Workloads zu Microsoft Fabric oder einem gleichwertigen Azure-Produkt migrieren, um eine abruptes Beendigung Ihrer Workloads zu vermeiden. Die verbleibenden Cluster in Ihrem Abonnement werden beendet und vom Host entfernt.

Bis zum Einstellungsdatum ist nur grundlegende Unterstützung verfügbar.

Wichtig

Diese Funktion steht derzeit als Vorschau zur Verfügung. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure-Vorschauen enthalten weitere rechtliche Bestimmungen, die für Azure-Features in Betaversionen, in Vorschauversionen oder anderen Versionen gelten, die noch nicht allgemein verfügbar gemacht wurden. Informationen zu dieser spezifischen Vorschau finden Sie unter Informationen zur Vorschau von Azure HDInsight on AKS. Bei Fragen oder Funktionsvorschlägen senden Sie eine Anfrage an AskHDInsight mit den entsprechenden Details, und folgen Sie uns für weitere Updates in der Azure HDInsight-Community.

In HDInsight auf AKS haben alle Clusterverwaltung und -vorgänge native Unterstützung für Dienstverwaltung im Azure-Portal für einzelne Cluster.

In HDInsight auf AKS werden zwei neue Konzepte eingeführt:

Clusterpools werden zum Gruppieren und Verwalten von Clustern verwendet.
Werden Cluster für Open Source-Berechnungen verwendet, werden sie in einem Clusterpool gehostet.

Clusterpools

HDInsight auf AKS wird auf Azure Kubernetes Service (AKS) ausgeführt. Die Ressource auf oberster Ebene ist der Clusterpool und verwaltet alle Cluster, die auf demselben AKS-Cluster ausgeführt werden. Wenn Sie einen Clusterpool erstellen, wird gleichzeitig ein zugrunde liegender AKS-Cluster erstellt, um alle Cluster im Pool zu hosten. Clusterpools sind eine logische Gruppierung von Clustern, die bei der Erstellung einer stabilen Interoperabilität über mehrere Clustertypen hinweg helfen und es Unternehmen ermöglichen, die Cluster im selben virtuellen Netzwerk zu haben. Clusterpools bieten schnellen und kostengünstigen Zugriff auf alle Clustertypen, die bei Bedarf und im Großen und Maßstab erstellt wurden. Ein Clusterpool entspricht einem Cluster in der AKS-Infrastruktur.

Cluster

Cluster sind einzelne Open-Source-Computeworkloads wie Apache Spark, Apache Flink und Trino, die in wenigen Minuten mit voreingestellten Konfigurationen und wenigen Klicks schnell erstellt werden können. Obwohl sie auf demselben Clusterpool ausgeführt wird, kann jeder Cluster eigene Konfigurationen haben, z. B. Clustertyp, Version, Größe des virtuellen Knotens, Knotenanzahl. Cluster werden auf getrennten Computeressourcen mit eigenen DNS- und Endpunkten ausgeführt.

Funktionen, die sich derzeit in der Vorschauphase befinden

In der folgenden Tabellenliste sind die Features von HDInsight auf AKS aufgeführt, die sich derzeit in der Vorschau befinden. Previewfunktionen werden alphabetisch sortiert.

Bereich	Funktionen
Grundlagen	Erstellen von Pool und Clustern mithilfe des Portals, Unterstützung der sicheren Webshell (SSH), Auswahl der Anzahl der Workerknoten während der Clustererstellung
Storage	ADLS Gen2-Speicher-Support
Metastore	Support für externe Metastores für Trino, Spark und Flink, Integration in HDInsight
Sicherheit	Support für ARM RBAC, Support für MSI-basierte Authentifizierung, Option zum Bereitstellen des Clusterzugriffs auf andere Benutzer
Protokollierung und Überwachung	Protokollaggregation in Azure-Protokollanalysen, für Serverprotokolle, Cluster- und Dienstmetriken über verwaltetes Prometheus und Grafana, Support von Servermetriken in Azure Monitor, Dienststatusseite zur Überwachung von Integritätsdienst
Automatische Skalierung	Lastbasierte automatische Skalierung und Planen der automatischen Skalierung
Anpassen und Konfigurieren von Clustern	Support für Skriptaktionen während der Clustererstellung, Unterstützung für Bibliotheksverwaltung, Dienstkonfigurationseinstellungen nach der Clustererstellung
Trino	Unterstützung für Trino-Kataloge, Trino CLI-Support, DBeaver-Support für die Abfrageübermittlung, Hinzufügen oder Entfernen von Plug-Ins und Connectors, Support für Protokollierungsabfrageevents, Support für Scanabfragestatistiken für jeden Connector im Trino-Dashboard, Unterstützung für Trino-Dashboard zum Überwachen von Abfragen, Abfragezwischenspeicherung, Integration mit PowerBI, Integration mit Apache Superset, Redash, Unterstützung für mehrere Connectors
Flink	Unterstützung für Flink native Web-UI, Flink-Unterstützung mit HMS für DStream, Senden von Aufträgen an den Cluster mithilfe vonREST-API und Azure Portal, Ausführen von Programmen, die als JAR-Dateien über dieFlink CLI gepackt sind, Unterstützung für persistente Speicherpunkte, Unterstützung für Updates der Konfigurationsoptionen während der Auftragsausführung, Herstellen einer Verbindung mit mehreren Azure-Diensten:Azure Cosmos DB,Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Wokflow Orchestration Manager, HDInsight Kafka, Senden von Aufträgen an den Cluster mithilfe von Flink CLI und CDC mit Flink
Spark	Jupyter Notebook, Support für Delta Lake 2.0, Zeppelin Support, Support ATS, Support für Yarn History Server Interface, Auftragsübermittlung mit SSH, Auftragsübermittlung mit SDK und Machine Learning Notebook

Roadmap der Funktionen

Funktion	Geschätzte Release-Zeitachse	Status
Autoskalierung – Lastbasiert – Trino	Q1 2024	Abgeschlossen
Lastbasierte automatische Skalierung für Spark	Q2 2024	In Bearbeitung
Direktes Upgrade	Q2 2024	Abgeschlossen
Support für reservierte Instanzen	Q2 2024	In Bearbeitung
MSI-basierte Authentifizierung für Metastore (SQL)	Q1 2024	In Bearbeitung
SPARK 3.4	Q2 2024	In Bearbeitung
Trino 426	Q1 2024	Abgeschlossen
Ranger für RBAC	Q2 2024	In Bearbeitung
Unterstützung für den App-Modus für Flink	Q1 2024	Abgeschlossen
Flink 1.17	Q1 2024	Abgeschlossen
Spark ACID-Support	Q1 2024	In Bearbeitung
Konfigurierbare SKUs für Headnode, SSH	Q2 2024	In Bearbeitung
Flink-SQL-Gateways-Support	Q1 2024	Abgeschlossen
Private Cluster für HDInsight on AKS	Q1 2024	Abgeschlossen
Ranger-Support für Spark SQL	Q4 2024	In Bearbeitung
Ranger ACLs auf Speicherebene	Q4 2024	In Bearbeitung
Unterstützung für One Lake als primärer Container	Q2 2024	Vorgang wird ausgeführt

Freigeben über

Was ist neu in HDInsight auf AKS? (Vorschau)

Clusterpools

Cluster

Funktionen, die sich derzeit in der Vorschauphase befinden

Roadmap der Funktionen

Feedback

Zusätzliche Ressourcen