Szenarios für die Verwendung von Azure Data Explorer
Hier besprechen wir, wie Sie entscheiden können, ob der Azure Daten-Explorer die richtige Wahl für Ihre Big Data-Analyseanforderungen ist. Anhand der folgenden Kriterien können Sie feststellen, ob der Azure Daten-Explorer Ihre Leistungs- und Funktionsziele erfüllt.
- Interaktive Analysen
- Datenvielzahl
- Datengeschwindigkeit
- Datenmenge
- Datenorganisation
- Abfrageparallelität
- Erstellen im Vergleich zu Kaufen
Entscheidungskriterien
Der Azure Daten-Explorer ist eine interaktive Big-Data-Analyseplattform, die Benutzer*innen in die Lage versetzt, datengestützte Entscheidungen in einer hochgradig agilen Umgebung zu treffen. Die hier aufgelisteten Faktoren können Ihnen helfen zu beurteilen, ob Azure Daten-Explorer für die jeweilige Workload geeignet ist. Stellen Sie sich die folgenden wichtigen Fragen:
Interaktive Analysen
Muss ich Daten interaktiv analysieren?
Die Datenanalyse umfasst Techniken wie Aggregation, Bereichsermittlung, Bewertung, Korrelation, Anomalieerkennung, Vorhersage und allgemeine Modellauswertung, mit denen große Datenmengen zu handlungsrelevanten Schlussfolgerungen reduziert werden können. In Azure Data Explorer geht es genau um das interaktive Durchführen solcher Aktivitäten. Diese Aktivitäten können in interaktiven Dashboards, analytischen benutzerdefinierten Anwendungen oder über die direkte Interaktion mit Daten über benutzerfreundliche Abfragen und Visualisierungen erfolgen. Azure Daten-Explorer ist möglicherweise nicht die richtige Technologie für die Ausführung von lang laufenden Batch-Aufträgen über Daten. Erwägen Sie den Einsatz von Technologien wie Microsoft Spark, die gut mit dem Azure Daten-Explorer zusammenarbeiten, für lang laufende Aufgaben.
Datenvielzahl
Wie unterschiedlich ist meine Datenstruktur?
Azure Data Explorer bietet skalierbare und hochleistungsfähige Volltextindexunterstützung sowie dynamische Schemaunterstützung. Wenn Sie strukturierte, teilweise strukturierte (JSON/XML) und texturale Daten analysieren und verarbeiten müssen, ist dies ein guter Hinweis darauf, dass Azure Data Explorer für Ihre Workload relevant ist.
Datengeschwindigkeit
Ist die Datenanalyse in Echtzeit ein wichtiger Faktor?
Azure Data Explorer kann sehr viele Daten schnell und mit geringer Latenz erfassen. Typische Datensätze sind Ablaufverfolgungen, Transaktionsprotokolle, Zeitreihen, Metriken und Aktivitätsdatensätze allgemein. Analysen in Quasi-Echtzeit für neue Daten sind ein gängiger Anwendungsfall. Azure Data Explorer kann gut mit Streamingtechnologien wie Azure Event Hubs, IoT Hubs und Kafka verknüpft werden, um solche Workloads zu unterstützen. Wenn Sie jedoch Echtzeit-Analysen benötigen, ist Azure Daten-Explorer möglicherweise nicht die beste Option.
Datenmenge
Wie viele Daten muss ich erfassen?
Azure Data Explorer ist so aufgebaut, dass über umfangreiche Datenworkloads Analysen für einen warmen Pfad interaktiv und über die API bereitstellt werden. In Szenarios, in denen die gesamt kumulierte Datengröße einige Gigabyte beträgt, gibt es möglicherweise andere kostengünstigere Lösungen.
Datenorganisation
Wie konsistent werden meine Daten organisiert?
Azure Data Explorer ist so konzipiert, um „Schema-on-Read“ auf Rohdaten anzuwenden. Dieser Ansatz bietet Flexibilität, Daten basierend auf den aktuellen Anforderungen auf unterschiedliche Weise und aus unterschiedlichen Blickwinkeln zu untersuchen. Diese Fähigkeit ist unter anderem für die Bewältigung unerwarteter Herausforderungen in den Bereichen Sicherheit, Vorgänge und Wettbewerb sinnvoll. Azure Data Explorer bietet Hochgeschwindigkeit, Skalierbarkeit und Kosteneffizienz für die Analyse von Rohdaten. Bei der Bereitstellung von Data Warehousing erzeugt ein ETL-Prozess (Extrahieren, Transformieren, Laden) in regelmäßigen Abständen eine gut kuratierte, hochgradig konsistente und gut dokumentierte Menge von Entitäten und Attributen. Analysen für diese komplexen Sternschemas umfassen in der Regel große Fakt-zu-Fakt-zu-Fakt-Joins, für die Azure Data Explorer nicht optimiert ist.
Abfrageparallelität
Wie viele Benutzer*innen müssen gleichzeitig Daten abfragen/eingehen/verarbeiten?
Azure Data Explorer wird allgemein für die Implementierung von SaaS-Analyseangeboten verwendet. Wenn es darum geht, unterschiedliche und einzigartige Analyseanforderungen einer großen Anzahl von Anforderungen parallel zu unterstützen, kann der Azure Daten-Explorer eine gute Lösung sein.
Erstellen im Vergleich zu Kaufen
In welchem Umfang möchte ich meine Datenplattform anpassen?
Azure Data Explorer ist ein vollständig verwaltetes Platform-as-a-Service-Modell. Er bietet jedoch keine sofort einsatzbereite, vorgefertigte Lösung. Für die Bereitstellung einer Lösung (Build), ist es zusätzlich zur Anzupassen, Konfiguration und Verknüpfung erforderlich, Funktionen zu erstellen. Es gibt verschiedene Lösungen von Microsoft und Drittanbietern, die den Azure Daten-Explorer nutzen, um solche schlüsselfertigen Lösungen für verschiedene Bereiche und Branchen zu liefern. Zum Beispiel Azure Monitor für IT-Vorgänge. Microsoft Advanced Threat Protection und Microsoft Sentinel im Bereich Sicherheit sowie Azure Time Series Insights und Azure IoT Central im Bereich IoT.
Anwenden der Kriterien
Azure Data Explorer funktioniert am besten, um für Wissensarbeiter interaktive Analysefunktionen mit hoher Geschwindigkeit und unterschiedlichen Rohdaten zu aktivieren. Lassen Sie uns darüber nachdenken, wie wir die Kriterien, die wir zuvor aufgelistet haben, auf unsere Beispielprozesse im Szenario des Bekleidungsunternehmens anwenden können.
Sollte Azure Data Explorer für Produktionsdaten verwendet werden?
Die Produktionsabteilung unseres Bekleidungsunternehmens muss Entscheidungen über die Verwaltung von Lagerbeständen und Produktionsvolumen treffen. Sie verfügen über Protokolle für eingehende Daten für die Inventur. Außerdem möchten sie räumliche Daten aus dem Marketing verwenden, um Produktanforderungen nach Region vorherzusagen. Diese Daten besitzen ein hohes Maß an Vielfalt, Geschwindigkeit und Volumen. Dort gibt es keine konsistente Organisation und viele Projektbeteiligte müssen diese Daten gleichzeitig abfragen. Von der Erfassung bis zur Abfrage ist dafür eine geringe Latenz erforderlich. Die Abfrageantwortzeiten müssen weniger als eine Sekunde oder noch weniger betragen. Basierend auf den Entscheidungskriterien eignet sich Azure Data Explorer gut für die Produktionsabteilung des Bekleidungsunternehmens.
Sollte Azure Data Explorer für Marketingdaten verwendet werden?
Die Marketingabteilung des Bekleidungsunternehmens möchte die Effektivität ihrer Kampagne bewerten. Das Team verfügt über Clickstreamdaten von der Website und aus den Werbekampagnen. Es verfügt auch über Freitextdaten (unstrukturierte Daten) aus sozialen Medien. Diese Daten sind sehr unterschiedlich und unorganisiert. Die Abteilung möchte explorative, interaktive Analysen durchführen. Basierend auf den Entscheidungskriterien eignet sich Azure Data Explorer gut für die Marketingabteilung des Bekleidungsunternehmens.
Zusammenfassung
Die folgende Tabelle zeigt, wie neue Anwendungsfälle ausgewertet werden. Auch wenn hier nicht alle Anwendungsfälle behandelt werden, sollte dieses Beispiel Ihnen helfen zu entscheiden, ob der Azure Daten-Explorer die richtige Lösung für Sie ist.
Anwendungsfall | Interaktive Analysen | Big Data (Vielfalt, Geschwindigkeit, Volumen) | Datenorganisation | Concurrency | Erstellen im Vergleich zu Kaufen | Sollte ich Azure Data Explorer verwenden? |
---|---|---|---|---|---|---|
Implementieren einer SaaS-Lösung für die Sicherheitsanalyse | Starke Nutzung interaktiver Analysen in Quasi-Echtzeit. | Sicherheitsdaten sind unterschiedliche daten mit hohem Volumen und hoher Geschwindigkeit. | Varies | Häufig verwenden mehrere Analyst*innen von mehreren Mandanten aus das System. | Die Implementierung eines SaaS-Angebots ist ein Buildszenario. | Ja |
CDN-Protokollanalyse | Interaktiv für die Problembehandlung, QoS-Überwachung | CDN-Protokolle sind unterschiedlich, mit hohem Volumen und hoher Geschwindigkeit. | Trennen von Protokolldatensätzen | Eine kleine Gruppe von Data Scientists kann diese Analysen nutzen, aber es können auch viele Dashboards damit befüllt werden. | Der aus den CDN-Analysen gewonnene Wert ist szenariospezifisch und erfordert benutzerdefinierte Analysen. | Ja |
Zeitreihendatenbank für die IoT-Telemetrie | Interaktiv zur Problembehandlung, Analyse von Trends, Nutzung und Erkennung von Anomalien. | IoT-Telemetrie ist sehr schnell, kann aber nur strukturiert oder mittelgroß sein. | Verwandte Datensätze | Eine kleine Gruppe von Data Scientists kann diese Analysen nutzen, aber es können auch viele Dashboards damit befüllt werden. | Bei der Suche nach einer Datenbank ist der Kontext normalerweise Build. | Ja |
Das folgende Flussdiagramm fasst die wichtigsten Fragen zusammen, die Sie sich stellen sollten, wenn Sie den Einsatz von Azure Daten-Explorer in Erwägung ziehen.