Anwendungsfälle für Azure HDInsight
Mit HDInsight können Sie Big Data in vielen Szenarien unter Verwendung von historischen Daten oder Echtzeitdaten verarbeiten. Aber ist das auch sinnvoll? Eine der größten Stärken von HDInsight sind die vielen Konfigurationsmöglichkeiten. In dieser Lerneinheit überlegen Sie, ob HDInsight die richtige Wahl für Ihre Organisation ist. Bei der Entscheidungsfindung analysieren Sie die folgenden Kriterien:
- Art und Umfang der Workloads
- Skalierbarkeit
- Fehlertoleranz
- Sicherheit
Entscheidungskriterien
Um festzustellen, ob HDInsight die Big Data-Anforderungen Ihrer Organisation erfüllen kann, verwenden Sie die in der folgenden Tabelle beschriebenen Kriterien:
Kriterien | Analyse |
---|---|
Art und Umfang der Workloads | Wenn verschiedene Workloads unterstützt werden müssen, benötigen Sie eine Plattform, die diese Anforderungen unterstützen kann. |
Skalierbarkeit | Benötigt Ihre Organisation Skalierungsmöglichkeiten, um eine größere Datenmenge und eine höhere Datengeschwindigkeit zu unterstützen? Sie müssen eine Plattform auswählen, die automatisch skaliert werden kann und eine unabhängige Skalierung von Compute- und Speicherressourcen unterstützt. |
Fehlertoleranz | Wenn Ihre Datenanalyse auch bei einem Ausfall von Komponenten fortgesetzt werden muss, müssen Sie eine fehlertolerante Plattform auswählen. |
Security | Die meisten Organisationen erwarten, dass die verarbeiteten Daten im Ruhezustand und bei der Übertragung sicher sind. Darüber hinaus müssen fast alle Organisationen die Compliancestandards von Behörden erfüllen. |
Anwenden der Kriterien
Überlegen Sie, wie Ihre Organisation Big Data verarbeiten möchte. Wenden Sie nun die Entscheidungskriterien an, um festzustellen, ob HDInsight eine gute Wahl ist:
Art und Umfang der Workloads: HDInsight unterstützt eine Vielzahl verschiedener Workloads. Diese Workloads können Batchdatenverarbeitung, Verarbeitung von Streamingdaten oder Verwaltung von Data Warehouse- und/oder Data Science-Workloads sein. Dieses Feature macht HDInsight noch interessanter, wenn Ihr Geschäftsprozess mehrere Workloads umfasst.
Skalierbarkeit: HDInsight unterstützt unabhängig skalierbare Compute- und Speicherressourcen. Außerdem können Workerknoten abhängig von der Workload oder einem Zeitplan automatisch skaliert werden.
Tipp
Durch die Trennung von Compute- und Speicherressourcen sowie die automatische Clusterskalierung können sich erhebliche Kostenoptimierungen ergeben.
Fehlertoleranz: Die Hauptknoten von HDInsight sind ausfallsicher und werden durch fehlertolerante VMs abgesichert. sodass dieser Dienst hoch verfügbar mit einer SLA von 99,9 % ist.
Sicherheit: Die Microsoft Entra-Integration ermöglicht unternehmensweite Sicherheitsfunktionen für Authentifizierung und Autorisierung. Diese Funktionen ermöglichen zusätzlich zur Unterstützung für Verschlüsselung und virtuelle Netzwerke eine präzise Steuerung der Personen, die Zugriff auf die Daten erhalten.
Zusammenfassend lässt sich sagen, dass Sie in den folgenden Situationen HDInsight in Betracht ziehen sollten:
Erfassung umfangreicher Datenmengen im großen Stil, und:
- Gewinnung von Erkenntnissen in Echtzeit.
- Verarbeitung der Daten mit optimierten Kosten, minimalem Aufwand und hoher Sicherheit.
Migrieren:
- Migration einer lokalen, anbieterspezifischen Open-Source-Software-Hadoop-Verteilung in die Cloud mit möglichst wenig Kosten und Aufwand.
- Migration eines von einem Mitbewerber angebotenen Open-Source-Software-Diensts für Big Data in der Cloud zu Azure.