Analyse und Business Intelligence (BI) für Ihre Azure Cosmos DB-Daten

Azure Cosmos DB bietet verschiedene Optionen für umfangreiche Analysen und BI-Berichte zu Ihren operativen Daten.

Um aussagekräftige Einblicke in Ihre Azure Cosmos DB-Daten zu erhalten, müssen Sie möglicherweise mehrere Partitionen, Sammlungen oder Datenbanken abfragen. In bestimmten Fällen können Sie diese Daten mit anderen Datenquellen in Ihrer Organisation kombinieren, z. B. Azure SQL-Datenbank und Azure Data Lake Storage Gen2. Für Abfragen können Sie auch Aggregatfunktionen wie „Summieren“ und „Zählen“ verwenden. Solche Abfragen benötigen eine hohe Rechenleistung, die wahrscheinlich mehr Anforderungseinheiten (Request Units, RUs) verbraucht. Daher können diese Abfragen u. U. die Leistung Ihrer unternehmenskritischen Workload beeinträchtigen.

Um Transaktionsworkloads von den Leistungsauswirkungen komplexer analytischer Abfragen zu isolieren, werden Datenbankdaten mit komplexen ETL-Pipelines (Extract-Transform-Load) nachts an einem zentralen Ort aufgenommen. Solche ETL-basierten Analysen sind komplex, kostspielig und bieten verzögerte Erkenntnisse in Geschäftsdaten.

Azure Cosmos DB löst dieses Problem durch Zero ETL-basierte, kosteneffiziente Analyseangebote.

Zero ETL-basierte Analysen in Quasi-Echtzeit in Azure Cosmos DB

Azure Cosmos DB bietet Zero ETL-basierte Analysen Ihrer Daten in Quasi-Echtzeit, ohne die Leistung Ihrer Transaktionsworkloads oder Anforderungseinheiten RUs zu beeinträchtigen. Mit diesen Angeboten erübrigen sich komplexe ETL-Pipelines, sodass Ihre Azure Cosmos DB-Daten nahtlos für Analyse-Engines verfügbar sind. Dank einer geringeren Wartezeit auf Erkenntnisse können Sie das Kundenerlebnis verbessern und schneller auf Änderungen der Marktbedingungen oder Geschäftsumgebung reagieren. In diesen Beispielszenarios können Sie schnelle Einblicke in Ihre Daten erzielen.

Sie können die Zero ETL-basierte Analyse und BI-Berichterstattung in Azure Cosmos DB mit den folgenden Optionen aktivieren:

  • Spiegeln Ihrer Daten in Microsoft Fabric
  • Aktivieren von Azure Synapse Link für den Zugriff auf Daten aus Azure Synapse Analytics

Option 1: Spiegeln Ihrer Azure Cosmos DB-Daten in Microsoft Fabric

Mit einer Spiegelung können Sie Ihre Azure Cosmos DB-Datenbankdaten nahtlos in Microsoft Fabric übertragen. Mit Zero ETL können Sie mit den integrierten Analyse-, BI- und KI-Funktionen von Fabric schnelle, umfangreiche Geschäftsinformationen zu Ihren Azure Cosmos DB-Daten erhalten.

Ihre operativen Cosmos DB-Daten werden in Quasi-Echtzeit inkrementell in Fabric OneLake repliziert. Daten werden in OneLake im Open-Source-Format „Delta Parquet“ gespeichert und allen Analyse-Engines in Fabric zur Verfügung gestellt. Dank des offenen Zugriffs können Sie sie mit verschiedenen Azure-Diensten wie Azure Databricks und Azure HDInsight verwenden. OneLake trägt auch zur Vereinheitlichung Ihres Datenbestands für Ihre analytischen Anforderungen bei. Gespiegelte Daten können mit allen anderen Daten in OneLake verknüpft werden, z. B. mit Lakehouses, Warehouses oder Verknüpfungen. Sie können Azure Cosmos DB-Daten auch mit anderen gespiegelten Datenbankquellen wie Azure SQL-Datenbank und Snowflake verknüpfen. Zudem können Sie Azure Cosmos DB-Sammlungen oder -Datenbanken abfragen, die in OneLake gespiegelt sind.

Mit der Spiegelung in Fabric vermeiden Sie, verschiedene Dienste von mehreren Anbietern kombinieren zu müssen. Stattdessen können Sie ein hochgradig integriertes, umfassendes und benutzerfreundliches Produkt nutzen, das auf die vereinfachte Verwaltung von Analysen ausgelegt ist. Sie können T-SQL zur Ausführung komplexer Aggregatabfragen und Spark zur Datenexploration verwenden. Sie können nahtlos auf die Daten in Notebooks zugreifen, Machine-Learning-Modelle mithilfe von Data Science erstellen und Power BI-Berichte mithilfe von Direct Lake erstellen, die von der umfassenden Copilot-Integration unterstützt werden.

Darstellung der Azure Cosmos DB-Spiegelung in Microsoft Fabric

Wenn Sie Analysen zu Ihren Betriebsdaten in Azure Cosmos DB durchführen möchten, bietet Ihnen die Spiegelung folgende Möglichkeit:

  • Zero ETL-basierte, kosteneffiziente Analysen in Quasi-Echtzeit für Azure Cosmos DB-Daten ohne Auswirkungen auf den Verbrauch Ihrer RUs
  • Einfaches Bereitstellen von Daten in Fabric OneLake aus verschiedenen Quellen
  • Verbesserte Abfrageleistung der SQL-Engine beim Verarbeiten von Delta-Tabellen dank V-Order-Optimierungen
  • Verbesserte Kaltstartzeit der Spark-Engine dank umfassender Integration mit ML/Notebooks
  • One-Click-Integration mit Power BI mit Direct Lake und Copilot
  • Umfassendere App-Integration für den Zugriff auf Abfragen und Sichten mit GraphQL
  • Offener Zugriff auf andere Dienste und von anderen Diensten wie Azure Databricks

Für einen Einstieg in die Datenbankspiegelung besuchen Sie das Tutorial Erste Schritte mit der Datenbankspiegelung.

Azure Synapse Link für Azure Cosmos DB erstellt eine enge nahtlose Integration von Azure Cosmos DB mit Azure Synapse Analytics, die Zero ETL-basierte Analysen in Quasi-Echtzeit für Ihre operativen Daten ermöglicht. Transaktionsdaten werden nahtlos mit dem Analysespeicher synchronisiert, wo Daten in dem für Analysen optimierten Spaltenformat gespeichert werden.

Azure Synapse Analytics kann mithilfe von Azure Synapse Link ohne weitere Verschiebungen auf diese Daten im Analysespeicher zugreifen. Business Analysts, Data Engineers und Data Scientists können Synapse Spark oder Synapse SQL jetzt austauschbar verwenden, um Business Intelligence-, Analyse- und Machine Learning-Pipelines in Quasi-Echtzeit auszuführen.

Die folgende Abbildung zeigt die Integration von Azure Synapse Link in Azure Cosmos DB und Azure Synapse Analytics:

Abbildung von Azure Cosmos DB Synapse Link

Wichtig

Die Spiegelung in Microsoft Fabric ist jetzt als Vorschau für die NoSql-API verfügbar. Dieses Feature bietet alle Funktionen von Azure Synapse Link mit besserer Analyseleistung, der Möglichkeit, Ihren Datenbestand mit Fabric OneLake zu vereinheitlichen, und offenem Zugriff auf Ihre Daten in OneLake mit dem Delta Parquet-Format. Wenn Sie Azure Synapse Link in Erwägung ziehen, wird empfohlen, die Spiegelung auszuprobieren, um die Eignung für Ihr Unternehmen insgesamt zu beurteilen. Für einen Einstieg in die Datenbankspiegelung klicken Sie hier.

Für einen Einstieg in Azure Synapse Link besuchen Sie Erste Schritte mit Azure Synapse Link.

Echtzeitanalysen und BI in Azure Cosmos DB: weitere Optionen

Es gibt einige weitere Optionen für Echtzeitanalysen von Azure Cosmos DB-Daten:

Während diese Optionen der Vollständigkeit halber aufgeführt sind und gut mit einzelnen Partitionsabfragen in Echtzeit funktionieren, weisen sie bei analytischen Abfragen die folgenden Herausforderungen auf:

  • Beeinträchtigung der Workloadleistung:

    Analytische Abfragen sind tendenziell komplex und verbrauchen erhebliche Rechenkapazität. Wenn diese Abfragen direkt für Ihre Azure Cosmos DB-Daten ausgeführt werden, kann es bei Ihren Transaktionsabfragen zu einer Leistungsbeeinträchtigung kommen.

  • Kostenauswirkung:

    Wenn analytische Abfragen direkt für Ihre Datenbank oder Ihre Sammlungen ausgeführt werden, erhöhen sie den Bedarf an zugewiesenen RUs, da sie tendenziell komplex sind und mehr Rechenleistung benötigen. Eine erhöhte RU-Nutzung führt im Laufe der Zeit wahrscheinlich zu erheblichen Kostensteigerungen, wenn Sie aggregierte Abfragen ausführen.

Anstelle dieser Optionen wird empfohlen, die Datenbankspiegelung in Microsoft Fabric oder Azure Synapse Link zu verwenden. Diese stellt Zero ETL-Analysen bereit und hat keine Auswirkungen auf RUs oder die Leistung von Transaktionsworkloads.