Interactive Query in Azure HDInsight

Artikel
10/17/2024

Interactive Query (auch Apache Hive LLAP oder Low Latency Analytical Processing genannt) ist ein Azure HDInsight-Clustertyp. Interactive Query unterstützt speicherinternes Zwischenspeichern, wodurch Apache Hive-Abfragen schneller und viel interaktiver werden. Kunden verwenden Interactive Query, um Daten, die in Azure Storage und Azure Data Lake Storage gespeichert sind, äußerst schnell abzufragen. Interactive Query erleichtert Entwicklern und Data Scientists die Arbeit mit Big Data mit den BI-Tools, die sie am meisten lieben. HDInsight Interactive Query unterstützt verschiedene Tools für den mühelosen Zugriff auf Big Data.

Hinweis

Weitere Informationen zu geplanten Verbesserungen und Funktionen

Ein Interactive Query-Cluster unterscheidet sich von einem Apache Hadoop-Cluster. Er enthält nur den Hive-Dienst.

Sie können im Interactive Query-Cluster nur über die Apache Ambari-Hive-Ansicht, Beeline und den Microsoft Hive Open Database Connectivity-Treiber (Hive ODBC) auf den Hive-Dienst zugreifen. Sie können nicht über die Hive-Konsole, Templeton, die klassische Azure-Befehlszeilenschnittstelle oder Azure PowerShell darauf zugreifen.

Erstellen eines Interactive Query-Clusters

Informationen zum Erstellen eines HDInsight-Clusters finden Sie unter Einrichten von Clustern in HDInsight mit Hadoop, Spark, Kafka usw. Wählen Sie den Clustertyp „Interactive Query“ aus.

Wichtig

Die minimale Hauptknotengröße für interaktive Abfragecluster ist Standard_D13_v2. Weitere Informationen finden Sie unter Azure Virtual Machine Dimensionierungscharts.

Ausführen von Apache Hive-Abfragen über Interactive Query

Um Hive-Abfragen auszuführen, können Sie folgende Optionen nutzen:

Methode	BESCHREIBUNG
Microsoft Power BI	Weitere Informationen finden Sie unter Visualisieren von Interactive Query-Hive-Daten mit Power BI mithilfe direkter Abfragen in Azure HDInsight sowie unter Visualisieren von Apache Hive-Daten mit Microsoft Power BI mithilfe von ODBC in Azure HDInsight.
Visual Studio	Siehe Verbinden mit Azure HDInsight und Ausführen von Apache Hive-Abfragen mithilfe von Data Lake-Tools für Visual Studio
Visual Studio Code	Weitere Informationen finden Sie unter Verwenden von Visual Studio Code für Apache Hive, LLAP oder pySpark.
Apache Ambari-Hive-Ansicht	Siehe Verwenden der Apache Ambari-Hive-Ansicht mit Apache Hadoop in HDInsight Die Hive-Ansicht ist für HDInsight 4.0 nicht verfügbar.
Apache Beeline	Informationen finden Sie unter Verwenden des Apache Beeline-Clients mit Apache Hive. Sie können Beeline entweder über den Hauptknoten oder von einem leeren Edgeknoten aus verwenden. Am besten verwenden Sie Beeline von einem leeren Edgeknoten aus. Informationen zum Erstellen eines HDInsight-Clusters mit einem leeren Edgeknoten finden Sie unter Verwenden leerer Edgeknoten in HDInsight.
Hive ODBC	Informationen finden Sie unter Verbinden von Excel mit Apache Hadoop in Azure HDInsight mithilfe des Microsoft Hive ODBC-Treibers.

So suchen Sie die Verbindungszeichenfolge für die Java Database Connectivity (JDBC):

Navigieren Sie in einem Webbrowser zu https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, wobei CLUSTERNAME der Name Ihres Clusters ist.
Wählen Sie das Symbol für die Zwischenablage zum Kopieren der URL aus:

Nächste Schritte

Erfahren Sie, wie Sie Interactive Query-Cluster in HDInsight erstellen.
Erfahren Sie, wie Sie Big Data mit Power BI in Azure HDInsight visualisieren.
Erfahren Sie, wie Sie Apache Zeppelin zum Ausführen von Apache Hive-Abfragen in Azure HDInsight verwenden.

Freigeben über

Interactive Query in Azure HDInsight

Erstellen eines Interactive Query-Clusters

Ausführen von Apache Hive-Abfragen über Interactive Query

Nächste Schritte

Feedback

Zusätzliche Ressourcen