Überwachen von Azure HDInsight

Dieser Artikel beschreibt Folgendes:

  • Die Arten von Überwachungsdaten, die Sie für diesen Dienst sammeln können
  • Möglichkeiten zum Analysieren dieser Daten.

Hinweis

Wenn Sie bereits mit diesem Dienst und/oder Azure Monitor vertraut sind und nur wissen möchten, wie Überwachungsdaten analysiert werden, lesen Sie den Abschnitt Analysieren am Ende dieses Artikels.

Wenn Sie über unternehmenskritische Anwendungen und Geschäftsprozesse verfügen, die auf Azure-Ressourcen basieren, müssen Sie diese überwachen und Warnungen für Ihr System abrufen. Der Azure Monitor-Dienst sammelt und aggregiert Metriken und Protokolle aus jeder Komponente Ihres Systems. Azure Monitor bietet Ihnen eine Übersicht über Verfügbarkeit, Leistung und Resilienz und benachrichtigt Sie über Probleme. Sie können das Azure-Portal, PowerShell, die Azure CLI, die REST-API oder Clientbibliotheken verwenden, um Überwachungsdaten einzurichten und anzuzeigen.

Überwachungsoptionen für HDInsight

Die spezifischen Metriken und Protokolle, die für Ihren HDInsight-Cluster verfügbar sind, hängen von Ihrem Clustertyp und Ihren Tools ab. Azure HDInsight bietet die Clustertypen Apache Hadoop, Spark, Kafka, HBase und Interactive Query. Sie können Ihren Cluster über die Apache Ambari-Weboberfläche oder im Azure-Portal überwachen, indem Sie die Azure Monitor Integration aktivieren.

Apache Ambari-Überwachung

Mit Apache Ambari wird die Verwaltung, Konfiguration und Überwachung von HDInsight-Clustern durch die Bereitstellung einer Weboberfläche und einer REST-API vereinfacht. Ambari ist in allen Linux-basierten HDInsight-Clustern enthalten. Um Ambari zu verwenden, wählen Sie Ambari-Home auf der Seite Übersicht Ihres HDInsight-Clusters im Azure-Portal aus.

Informationen zur Verwendung von Ambari für die Überwachung finden Sie in den folgenden Artikeln:

Azure Monitor-Integration

Sie können Ihre HDInsight-Cluster auch direkt in Azure überwachen. Mit einer neuen Azure Monitor-Integration in der Vorschau können Sie auf Erkenntnisse, Protokolleund Arbeitsmappen aus Ihrem HDInsight-Cluster zugreifen, ohne den Log Analytics-Arbeitsbereich aufrufen zu müssen.

Um die neue Azure Monitor-Integration zu verwenden, aktivieren Sie sie, indem Sie Überwachen der Integration aus dem Abschnitt Monitoring im linken Menü der HDInsight-Seite in Ihrem Azure-Portals auswählen. Sie können auch PowerShell oder die Azure CLI verwenden, um die neue Überwachungsintegration zu aktivieren und damit zu interagieren. Weitere Informationen finden Sie im folgenden Artikel:

Erkenntnisse

Einige Dienste in Azure verfügen über ein integriertes Überwachungsdashboard im Azure-Portal, das einen Ausgangspunkt für die Überwachung Ihres Diensts bietet. Diese Dashboards werden als Erkenntnisse bezeichnet, und Sie finden sie im Erkenntnishub von Azure Monitor im Azure-Portal.

Integration des Erkenntnis-Clusterportals

Nachdem Sie die Azure Monitor-Integration aktiviert haben, können Sie im linken Menü der HDInsight-Seite in Ihrem Azure-Portal die Option Erkenntnisse (Vorschau) auswählen, um ein automatisch ausgefülltes Dashboard zur Visualisierung von Protokollen und Metriken anzuzeigen, das speziell auf den Typ Ihres Clusters zugeschnitten ist. Das Erkenntnisse-Dashboard verwendet eine vordefinierte Azure-Arbeitsmappe mit Abschnitten für jeden Clustertyp, YARN, Systemmetriken und Komponentenprotokolle.

Screenshot des Dashboards des Visualisierungsdashboards.

Diese detaillierten Graphen und Visualisierungen bieten Ihnen tiefe Einblicke in die Leistung und Integrität Ihres Clusters. Weitere Informationen finden Sie unter Verwenden der sofort einsatzbereiten HDInsight-Erkenntnisse zum Überwachen eines einzelnen Clusters.

Ressourcentypen

Azure verwendet das Konzept von Ressourcentypen und IDs, um alles in einem Abonnement zu identifizieren. Ressourcentypen sind auch Teil der Ressourcen-IDs für jede Ressource, die in Azure ausgeführt wird. Beispiel: Ein Ressourcentyp für eine VM ist Microsoft.Compute/virtualMachines. Eine Liste der Dienste und ihrer zugehörigen Ressourcentypen finden Sie unter Ressourcenanbieter.

Ähnliche organisiert Azure Monitor die Kernüberwachungsdaten in Metriken und Protokollen basierend auf Ressourcentypen, die auch als Namespaces bezeichnet werden. Für unterschiedliche Ressourcentypen stehen unterschiedliche Metriken und Protokolle zur Verfügung. Ihr Dienst ist möglicherweise mehr als einem Ressourcentyp zugeordnet.

Weitere Informationen zu den Ressourcentypen für HdInsight finden Sie unter HDInsight-Überwachungsdatenreferenz.

Datenspeicher

For Azure Monitor:

  • Metrikdaten werden in der Azure Monitor-Metrikendatenbank gespeichert.
  • Protokolldaten werden im Azure Monitor-Protokollspeicher gespeichert. Log Analytics ist ein Tool im Azure-Portal zum Abfragen dieses Speichers.
  • Das Azure-Aktivitätsprotokoll ist ein separater Speicher mit eigener Schnittstelle im Azure-Portal.

Optional können Sie Metrik- und Aktivitätsprotokolldaten an den Azure Monitor-Protokollspeicher weiterleiten. Anschließend können Sie Log Analytics verwenden, um die Daten abzufragen und mit anderen Protokolldaten zu korrelieren.

Viele Dienste können Diagnoseeinstellungen verwenden, um Metrik- und Protokolldaten an andere Speicherorte außerhalb von Azure Monitor zu senden. Beispiele umfassen Azure Storage, gehostete Partnersysteme und Nicht-Azure-Partnersysteme, die Event Hubs verwenden.

Detaillierte Informationen dazu, wie Azure Monitor Daten speichert, finden Sie unter Azure Monitor-Datenplattform.

HDInsight speichert die Protokolldateien sowohl im Clusterdateisystem als auch in Azure Storage. Aufgrund der großen Anzahl und Größe von Protokolldateien ist es wichtig, die Speicherung und Archivierung von Protokollen zu optimieren, um das Kostenmanagement zu erleichtern. Weitere Informationen finden Sie unter Verwalten von Protokollen für einen HDInsight-Cluster.

Azure Monitor-Plattformmetriken

Azure Monitor stellt Plattformmetriken für die meisten Dienste bereit. Diese Metriken sind:

  • Einzeln für jeden Namespace definiert.
  • In der Azure Monitor-Datenbank für Zeitreihenmetriken gespeichert.
  • Einfach strukturiert und in der Lage, Warnmeldungen in Quasi-Echtzeit zu unterstützen.
  • Verwendet zum Nachverfolgen der Leistung einer Ressource im Zeitverlauf.

Erfassung: Azure Monitor sammelt Plattformmetriken automatisch. Es ist keine Konfiguration erforderlich.

Routing: Sie können einige Plattformmetriken auch an Azure Monitor-Protokolle/Log Analytics weiterleiten, damit Sie diese mit anderen Protokolldaten abfragen können. Überprüfen Sie anhand der Einstellung DS-Export für die einzelnen Metriken, ob Sie eine Diagnoseeinstellung zum Weiterleiten der jeweiligen Metrik an Azure Monitor-Protokolle/Log Analytics verwenden können.

Eine Liste aller Metriken, die für alle Ressourcen in Azure Monitor gesammelt werden können, finden Sie unter Unterstützte Metriken in Azure Monitor.

Eine Liste der Metriken, die automatisch für HDInsight gesammelt werden, finden Sie unter HDInsight-Überwachungsdatenreferenz.

Azure Monitor-Ressourcenprotokolle

Ressourcenprotokolle bieten Einblicke in Vorgänge, die von einer Azure-Ressourcen ausgeführt wurden. Protokolle werden automatisch generiert, aber Sie müssen sie an Azure Monitor-Protokolle weiterleiten, um sie zu speichern oder abzufragen. Protokolle sind in Kategorien organisiert. Ein bestimmter Namespace verfügt möglicherweise über mehrere Ressourcenprotokollkategorien.

Sammlung: Ressourcenprotokolle werden erst gesammelt und gespeichert, nachdem Sie eine Diagnoseeinstellung erstellt und die Protokolle an mindestens einen Speicherort weitergeleitet haben. Wenn Sie eine Diagnoseeinstellung erstellen, legen Sie fest, welche Kategorien von Protokollen gesammelt werden sollen. Es gibt mehrere Möglichkeiten zum Erstellen und Verwalten von Diagnoseeinstellungen, u. a. das Azure-Portal, programmgesteuert und über Azure Policy.

Routing: Der vorgeschlagene Standard besteht darin, Ressourcenprotokolle an Azure Monitor-Protokolle weiterzuleiten, damit Sie diese mit anderen Protokolldaten abfragen können. Andere Speicherorte wie z. B. Azure Storage, Azure Event Hubs und bestimmte Microsoft-Überwachungspartner sind ebenfalls verfügbar. Weitere Informationen finden Sie unter Azure-Ressourcenprotokolle und Ressourcenprotokollziele.

Ausführliche Informationen zum Sammeln, Speichern und Weiterleiten von Ressourcenprotokollen finden Sie unter Diagnoseeinstellungen in Azure Monitor.

Eine Liste aller verfügbaren Ressourcenprotokollkategorien in Azure Monitor finden Sie unter Unterstützte Ressourcenprotokolle in Azure Monitor.

Alle Ressourcenprotokolle in Azure Monitor enthalten dieselben Headerfelder, gefolgt von dienstspezifischen Feldern. Das allgemeine Schema wird in Azure Monitor-Ressourcenprotokollschema beschrieben.

Vom Agenten gesammelte Protokolle

HDInsight erstellt keine Ressourcenprotokolle auf die übliche Weise. Stattdessen sammelt es Protokolle innerhalb des HDInsight-Clusters und sendet sie mithilfe des Log Analytics Agent an Azure Monitor Logs / Log Analytics-Tabellen.

Ein HDInsight-Cluster erzeugt viele Protokolldateien, wie z. B.:

  • Auftragsausführungsprotokolle
  • YARN-Protokolle für Resource Manager-Dateien
  • Skriptaktionsprotokolle
  • Benachrichtigungsstatus für Ambari-Cluster
  • Ambari-Systemmetriken
  • Sicherheitsprotokolle
  • Hadoop-Aktivitäten, die in den Protokolldateien des Controllers, stderr und syslog, protokolliert werden

Welche Protokolle verfügbar sind, hängt von Ihrem Cluster-Framework und Ihren Tools ab. Sobald Sie die Azure Monitor-Integration für Ihren Cluster aktiviert haben, können Sie jedes dieser Protokolle anzeigen und abfragen.

Selektive Protokollierung

HDInsight-Cluster können viele ausführliche Protokolle erfassen. Um Überwachungs- und Speicherkosten zu sparen, können Sie die selektive Protokollierungsfunktion mit Hilfe von Skriptaktionen für HDInsight im Azure-Portal aktivieren. Mit der selektiven Protokollierung können Sie verschiedene über Log Analytics verfügbare Protokolle und Metrik-Quellen ein- und ausschalten. Bei diesem Feature müssen Sie nur für das bezahlen, was Sie verwenden.

Sie können die Protokollsammlung und -analyse konfigurieren, um Tabellen im Log Analytics-Arbeitsbereich zu aktivieren oder zu deaktivieren und den Quellentyp für jede Tabelle anzupassen. Detaillierte Anweisungen finden Sie unter Verwenden selektiver Protokollierung mit einer Skriptaktion in Azure HDInsight.

Azure-Aktivitätsprotokoll

Das Aktivitätsprotokoll enthält Ereignisse auf Abonnementebene, die Vorgänge für jede Azure-Ressource nachverfolgen, so wie sie von außerhalb dieser Ressource gesehen werden, z. B. das Erstellen einer neuen Ressource oder das Starten einer VM.

Sammlung: Aktivitätsprotokollereignisse werden automatisch generiert und in einem separaten Speicher für die Anzeige im Azure-Portal gesammelt.

Routing: Sie können Aktivitätsprotokolldaten an Azure Monitor-Protokolle senden, damit Sie diese zusammen mit anderen Protokolldaten analysieren können. Andere Speicherorte wie z. B. Azure Storage, Azure Event Hubs und bestimmte Microsoft-Überwachungspartner sind ebenfalls verfügbar. Weitere Informationen zum Weiterleiten von Aktivitätsprotokollen finden Sie unter Übersicht über das Azure-Aktivitätsprotokoll.

Analysieren von Überwachungsdaten

Es gibt viele Tools zum Analysieren von Überwachungsdaten.

Azure Monitor-Tools

Azure Monitor unterstützt die folgenden grundlegenden Tools:

Zu den Tools, die eine komplexere Visualisierung ermöglichen, gehören:

  • Dashboards, mit denen Sie verschiedene Typen von Daten in einen einzelnen Bereich im Azure-Portal kombinieren können.
  • Arbeitsmappen, anpassbare Berichte, die Sie im Azure-Portal erstellen können. Arbeitsmappen können Text, Metriken und Protokollabfragen enthalten.
  • Grafana, ein Tool auf einer offenen Plattform, das für operationale Dashboards ideal ist. Sie können Grafana verwenden, um Dashboards zu erstellen, die Daten aus mehreren anderen Quellen als Azure Monitor enthalten.
  • Power BI ist ein Geschäftsanalysedienst, der interaktive Visualisierungen für verschiedene Datenquellen bereitstellt. Sie können Power BI für den automatischen Import von Protokolldaten aus Azure Monitor konfigurieren, um diese Visualisierungen zu nutzen.

Azure Monitor Logs sammelt Daten von Ihren HDInsight-Cluster-Ressourcen und von anderen Überwachungstools und nutzt die Daten, um Analysen über mehrere Quellen hinweg zu erstellen.

Exporttools für Azure Monitor

Sie können Daten aus Azure Monitor in andere Tools abrufen, indem Sie die folgenden Methoden verwenden:

Informationen zu den ersten Schritten mit der REST-API für Azure Monitor finden Sie in der exemplarischen Vorgehensweise für die Azure-Überwachungs-REST-API.

Kusto-Abfragen

Sie können Überwachungsdaten im Azure Monitor Logs / Log Analytics Store mithilfe der Kusto-Abfragesprache (KQL) analysieren.

Wichtig

Wenn Sie Protokolle im Menü des Diensts im Portal auswählen, wird Log Analytics geöffnet, wobei der Abfragebereich auf den aktuellen Dienst festgelegt ist. Dieser Bereich bedeutet, dass Protokollabfragen nur Daten aus diesem Ressourcentyp umfassen. Wenn Sie eine Abfrage durchführen möchten, die Daten aus anderen Azure-Diensten enthält, wählen Sie im Menü Azure Monitor die Option Protokolle aus. Ausführliche Informationen finden Sie unter Protokollabfragebereich und Zeitbereich in Azure Monitor Log Analytics.

Eine Liste häufiger Abfragen für alle Dienste finden Sie unter Log Analytics-Abfrageschnittstelle.

Nachdem Sie die Azure Monitor-Integration aktiviert haben, können Sie Protokolle (Preview) in der linken Navigation für Ihre HDInsight-Portalseite auswählen und dann die Registerkarte Abfragen auswählen, um Beispielabfragen für Ihren Cluster anzuzeigen. Die folgende Abfrage listet zum Beispiel alle bekannten Computer auf, die in den letzten fünf Stunden keinen Heartbeat gesendet haben.

// Unavailable computers 
Heartbeat
| summarize LastHeartbeat=max(TimeGenerated) by Computer
| where LastHeartbeat < ago(5h)

Die folgende Abfrage ermittelt die 10 ressourcenintensivsten Abfragen der letzten 24 Stunden, basierend auf dem CPU-Verbrauch.

// Top 10 resource intensive queries 
LAQueryLogs
| top 10 by StatsCPUTimeMs desc nulls last

Wichtig

Die neue Azure Monitor-Integration implementiert neue Tabellen in den Log Analytics-Arbeitsbereich. Um möglichst viele Unklarheiten zu beseitigen, gibt es weniger Schemata, und die Schemaformatierung ist besser organisiert und leichter zu verstehen.

Die neue Überwachungsintegration im Azure-Portal verwendet die neuen Tabellen, aber Sie müssen ältere Abfragen und Dashboards überarbeiten, um die neuen Tabellen zu verwenden. Die Zuordnungen der Protokolltabellen aus der klassischen Azure Monitor-Integration zu den neuen Tabellen finden Sie unter Zuordnung der Protokolltabellen.

Alerts

Azure Monitor-Warnungen informieren Sie proaktiv, wenn bestimmte Bedingungen in Ihren Überwachungsdaten auftreten. Warnungen ermöglichen Ihnen, Probleme in Ihrem System zu identifizieren und zu beheben, bevor Ihre Kunden sie bemerken. Weitere Informationen finden Sie unter Azure Monitor-Warnungen.

Es gibt viele Quellen allgemeiner Warnungen für Azure-Ressourcen. Beispiele für häufige Warnungen für Azure-Ressourcen finden Sie in den Beispielabfragen für Protokollwarnungen. Die Website Azure Monitor-Baselinewarnungen (Azure Monitor Baseline Alerts, AMBA) stellt eine halbautomatisierte Methode für die Implementierung wichtiger Metrikwarnungen der Plattform, Dashboards und Richtlinien bereit. Die Website gilt für eine fortlaufend erweiterte Teilmenge von Azure-Diensten, einschließlich aller Dienste, die Teil der Azure-Zielzone (Azure Landing Zone, ALZ) sind.

Mit dem allgemeinen Warnungsschema wird die Benutzeroberfläche für Warnungsbenachrichtigungen in Azure Monitor standardisiert. Weitere Informationen finden Sie unter Allgemeines Warnungsschema.

Warnungstypen

Sie können zu jeder Metrik oder Protokolldatenquelle der Azure Monitor-Datenplattform Warnungen erhalten. Es gibt viele verschiedene Typen von Warnungen, abhängig von den Diensten, die Sie überwachen, und den Überwachungsdaten, die Sie sammeln. Verschiedene Typen von Warnungen haben jeweils ihre Vor- und Nachteile. Weitere Informationen finden Sie unter Auswählen des richtigen Warnungsregeltyps.

In der folgenden Liste werden die Typen von Azure Monitor-Warnungen beschrieben, die Sie erstellen können:

  • Metrikwarnungen bewerten Ressourcenmetriken in regelmäßigen Abständen. Metriken können Plattformmetriken, benutzerdefinierte Metriken, in Metriken konvertierte Protokolle aus Azure Monitor oder Application Insights-Metriken sein. Metrikwarnungen können auch mehrere Bedingungen und dynamische Schwellwerte anwenden.
  • Protokollwarnungen ermöglichen es Benutzern, eine Log Analytics-Abfrage zum Auswerten von Ressourcenprotokollen in vordefinierten Frequenz zu verwenden.
  • Aktivitätsprotokollwarnungen werden ausgelöst, wenn ein neues Aktivitätsprotokollereignis eintritt, das definierte Bedingungen erfüllt. Resource Health- und Service Health-Warnungen sind Aktivitätsprotokollwarnungen, die über die Dienst- und Ressourcenintegrität berichten.

Einige Azure-Dienste unterstützen auch intelligente Erkennungswarnungen, Prometheus-Warnungen oder empfohlene Warnungsregeln.

Einige Dienste können Sie im großen Stil überwachen, indem Sie dieselbe Metrikwarnungsregel auf mehrere Ressourcen desselben Typs anwenden, die sich in derselben Azure-Region befinden. Für jede überwachte Ressource werden einzelne Benachrichtigungen gesendet. Unterstützte Azure-Dienste und -Clouds finden Sie unter Überwachen mehrerer Ressourcen mit einer Warnungsregel.

HDInsight-Warnungsregeln

Nachdem Sie die Azure Monitor-Integration aktiviert haben, können Sie Warnungen in der linken Navigation für Ihre HDInsight-Portalseite auswählen und dann Warnungsregel erstellen auswählen, um Warnungen zu konfigurieren. Sie können eine Warnung auf eine beliebige Log Analytics-Abfrage stützen oder Signale aus Metriken oder dem Aktivitätsprotokoll verwenden.

In der folgenden Tabelle werden einige Warnungsregeln für HDInsight beschrieben. Diese Warnungen sind nur Beispiele. Sie können Warnungen für alle Metriken, Protokolleinträge oder Aktivitätsprotokolleinträge festlegen, die in der HDInsight-Überwachungsdatenreferenz aufgeführt sind.

Warnungstyp Bedingung BESCHREIBUNG
Metrik Ausstehende CPU Immer wenn die maximal ausstehende CPU größer oder kleiner als der dynamische Schwellwert ist
Aktivitätsprotokoll Löschen von Clustern Wenn das Aktivitätsprotokoll über ein Ereignis mit „Category='Administrative', Signal name='Delete Cluster (HDInsight Cluster)'“ verfügt.

Ein Beispiel zum Erstellen einer Warnung finden Sie unter Azure Monitor-Warnungen.

Advisor-Empfehlungen

Wenn in einigen Diensten während eines Ressourcenvorgangs kritische Bedingungen oder unmittelbar bevorstehende Änderungen auftreten, wird auf der Dienstseite Übersicht im Portal eine Warnung angezeigt. Weitere Informationen und empfohlene Korrekturen für die Warnung finden Sie in Advisor-Empfehlungen unter Überwachung im linken Menü. Während des normalen Betriebs werden keine Advisor-Empfehlungen angezeigt.

Weitere Informationen zu Azure Advisor finden Sie unter Azure Advisor – Übersicht.