Spegling av Azure Cosmos DB (förhandsversion)

Spegling i Microsoft Fabric ger en sömlös no-ETL-upplevelse för att integrera dina befintliga Azure Cosmos DB-data med resten av dina data i Microsoft Fabric. Du kan kontinuerligt replikera dina Azure Cosmos DB-data direkt till Fabric OneLake nästan i realtid, utan att påverka prestandan för dina transaktionsarbetsbelastningar.

Data i OneLake lagras i deltaformat med öppen källkod och görs automatiskt tillgängliga för alla analysmotorer i Fabric.

Du kan använda T-SQL för att köra komplexa aggregerade frågor och Spark för datautforskning. Du kan sömlöst komma åt data i notebook-filer, använda datavetenskap för att skapa maskininlärningsmodeller och skapa business intelligence-rapporter med Direct Lake som drivs av Copilot integrering.

Viktigt!

Spegling för Azure Cosmos DB är för närvarande i förhandsversion. Produktionsarbetsbelastningar stöds inte under förhandsversionen. För närvarande stöds endast Azure Cosmos DB för NoSQL-konton.

Varför ska du använda spegling i Infrastrukturresurser?

Med spegling i Infrastruktur behöver du inte pussla ihop olika tjänster från flera leverantörer. I stället kan du njuta av en mycket integrerad, heltäckande och lätthanterad produkt som är utformad för att förenkla dina analysbehov och skapa för öppenhet.

Om du letar efter analys av dina driftdata i Azure Cosmos DB tillhandahåller spegling:

  • No-ETL, kostnadseffektiv nära realtidsanalys på Azure Cosmos DB-data utan att påverka din enhetsförbrukning för begäran
  • Enkel att föra data över olika källor till Fabric OneLake
  • Deltatabelloptimeringar med v-order för blixtsnabba läsningar
  • Integrering med ett klick med Power BI med Direct Lake och Copilot
  • Omfattande affärsinsikter genom att koppla data mellan olika källor
  • Mer omfattande appintegrering för åtkomst till frågor och vyer

OneLake-data lagras i Delta Lake-formatet med öppen källkod, så att du kan använda dem med olika lösningar inom och utanför Microsoft. Det här dataformatet gör det enklare att skapa en enda dataegendom för dina analytiska behov.

Vilka analysupplevelser är inbyggda?

Speglade databaser är ett objekt i Fabric Synapse Data Warehousing som skiljer sig från slutpunkten för lager- och SQL-analys.

Diagram över infrastrukturspegling för Azure Cosmos DB.

Varje Speglad Azure Cosmos DB-databas har tre objekt som du kan interagera med i din Infrastruktur-arbetsyta:

  • Det speglade databasobjektet. Spegling hanterar replikering av data till OneLake och konvertering till Parquet i ett analysklart format. Detta möjliggör nedströmsscenarier som datateknik, datavetenskap med mera.
  • SQL-analysslutpunkt, som genereras automatiskt
  • Standard semantisk modell, som genereras automatiskt

Speglad databas

Den speglade databasen visar replikeringsstatusen och kontrollerna för att stoppa eller starta replikeringen i Fabric OneLake. Du kan också visa källdatabasen i skrivskyddat läge med hjälp av Azure Cosmos DB-datautforskaren. Med datautforskaren kan du visa dina containrar i azure Cosmos DB-källdatabasen och köra frågor mot dem. De här åtgärderna använder enheter för programbegäran (RU: er) från ditt Azure Cosmos DB-konto. Alla ändringar i källdatabasen återspeglas omedelbart i Fabrics källdatabasvy. Det går inte att skriva till källdatabasen från Fabric eftersom du bara kan visa data.

SQL-analysslutpunkt

Varje speglad databas har en autogenererad SQL-analysslutpunkt som ger en omfattande analysupplevelse ovanpå OneLakes Delta-tabeller som skapats av speglingsprocessen. Du har åtkomst till välbekanta T-SQL-kommandon som kan definiera och köra frågor mot dataobjekt men inte ändra data från SQL-analysslutpunkten, eftersom det är en skrivskyddad kopia.

Du kan utföra följande åtgärder i SQL-analysslutpunkten:

  • Utforska Delta Lake-tabeller med T-SQL. Varje tabell mappas till en container från din Azure Cosmos DB-databas.
  • Skapa frågor och vyer utan kod och utforska dem visuellt utan att skriva en kodrad.
  • Koppla och fråga efter data i andra speglade databaser, lager och lakehouses på samma arbetsyta.

Förutom Microsoft Fabric SQL-Uređivač upita finns det ett brett ekosystem med verktyg. Dessa verktyg omfattar Visual Studio Code, Azure Data Studio, SQL Server Management Studio och till och med GitHub Copilot. Du kan överdebitera analys och insikter från det verktyg du väljer.

Semantisk modell

Standardsemantikmodellen är en automatiskt etablerad Power BI-semantisk modell. Med den här funktionen kan affärsmått skapas, delas och återanvändas. Mer information finns i semantiska modeller.

Hur fungerar replikering i nära realtid?

När du aktiverar spegling på din Azure Cosmos DB-databas replikeras kontinuerligt infognings-, uppdaterings- och borttagningsåtgärder på dina OLTP-data (Online Transaction Processing) till Fabric OneLake för analysförbrukning.

Funktionen för kontinuerlig säkerhetskopiering är en förutsättning för spegling. Du kan aktivera antingen 7- eller 30 dagars kontinuerlig säkerhetskopiering på ditt Azure Cosmos DB-konto.

Kommentar

Spegling använder inte Azure Cosmos DB:s analysarkiv eller ändringsflöde som en datainsamlingskälla för ändringar. Du kan fortsätta att använda dessa funktioner oberoende av varandra, tillsammans med spegling.

Det kan ta några minuter att replikera dina Azure Cosmos DB-data till Fabric OneLake. Beroende på dina datas första ögonblicksbild eller frekvensen för uppdateringar/borttagningar kan replikeringen också ta längre tid i vissa fall. Replikeringen påverkar inte de enheter för programbegäran (RU: er) som du allokerade för dina transaktionsarbetsbelastningar.

Vad du kan förvänta dig av spegling

Det finns några överväganden och scenarier som stöds som du bör överväga innan du spegling.

Konfigurationsöverväganden

För att spegla en databas bör den redan vara etablerad i Azure. Du måste aktivera kontinuerlig säkerhetskopiering av kontot som en förutsättning.

  • Du kan bara spegla varje databas individuellt i taget. Du kan välja vilken databas som ska speglas.
  • Du kan spegla samma databas flera gånger på samma arbetsyta. Som bästa praxis kan en enda kopia av databasen återanvändas i sjöhus, lager eller andra speglade databaser. Du bör inte behöva konfigurera flera speglar till samma databas.
  • Du kan också spegla samma databas på olika infrastrukturarbetsytor eller klientorganisationer.
  • Ändringar i Azure Cosmos DB-containrar, till exempel att lägga till nya containrar och ta bort befintliga, replikeras sömlöst till Fabric. Du kan till exempel börja spegla en tom databas utan containrar, och speglingen hämtar sömlöst de containrar som läggs till vid en senare tidpunkt.

Stöd för kapslade data

Kapslade data visas som en JSON-sträng i SQL Analytics-slutpunktstabeller. Du kan använda OPENJSON, CROSS APPLYoch OUTER APPLY i T-SQL-frågor eller vyer för att expandera dessa data selektivt. Om du använder Power Query kan du också använda ToJson funktionen för att expandera dessa data.

Kommentar

Infrastrukturresurser har en begränsning för strängkolumner med en storlek på 8 KB. Mer information finns i begränsningar för informationslager.

Hantera schemaändringar

Spegling replikerar automatiskt egenskaper i Azure Cosmos DB-objekt med schemaändringar. Alla nya egenskaper som identifieras i ett objekt visas som nya kolumner och eventuella saknade egenskaper representeras som null i Infrastrukturresurser.

Om du byter namn på en egenskap i ett objekt behåller Fabric-tabeller både de gamla och nya kolumnerna. Den gamla kolumnen visar null och den nya visar det senaste värdet för alla objekt som replikeras efter namnbytet.

Om du ändrar datatypen för en egenskap i Azure Cosmos DB-objekt stöds ändringarna för kompatibla datatyper som kan konverteras. Om datatyperna inte är kompatibla för konvertering i Delta representeras de som null-värden.

SQL-analysslutpunktstabeller konverterar Delta-datatyper till T-SQL-datatyper.

Duplicera kolumnnamn

Azure Cosmos DB stöder skiftlägesokänsliga kolumnnamn baserat på JSON-standarden. Spegling stöder dessa duplicerade kolumnnamn genom att lägga _n till i kolumnnamnet, där n det skulle vara ett numeriskt värde.

Om till exempel Azure Cosmos DB-objektet har addressName och AddressName som unika egenskaper har Fabric-tabeller motsvarande addressName och AddressName_1 kolumner. Mer information finns i replikeringsbegränsningar.

Säkerhet

Anslutningar till källdatabasen baseras på kontonycklar för dina Azure Cosmos DB-konton. Om du roterar eller återskapar nycklarna måste du uppdatera anslutningarna för att säkerställa att replikeringen fungerar. Mer information finns i anslutningar.

Kontonycklar visas inte direkt för andra Fabric-användare när anslutningen har konfigurerats. Du kan begränsa vem som har åtkomst till de anslutningar som skapats i Infrastrukturresurser. Skrivningar tillåts inte till Azure Cosmos DB-databasen, varken från datautforskaren eller analysslutpunkten i den speglade databasen.

Spegling stöder för närvarande inte autentisering med skrivskyddade kontonycklar, enkel inloggning (SSO) med Microsoft Entra-ID:n och rollbaserad åtkomstkontroll eller hanterade identiteter.

När data har replikerats till Fabric OneLake måste du skydda åtkomsten till dessa data.

Dataskyddsfunktioner

Detaljerad säkerhet kan konfigureras i den speglade databasen i Microsoft Fabric. Mer information finns i detaljerade behörigheter i Microsoft Fabric.

Du kan skydda kolumnfilter och predikatbaserade radfilter på tabeller till roller och användare i Microsoft Fabric:

Du kan också maskera känsliga data från icke-administratörsanvändare med hjälp av dynamisk datamaskning:

Nätverkssäkerhet

För närvarande stöder spegling inte privata slutpunkter eller kundhanterade nycklar (CMK) på OneLake. Spegling stöds inte för Azure Cosmos DB-konton med nätverkssäkerhetskonfigurationer som är mindre tillåtande än alla nätverk, som använder tjänstslutpunkter, använder privata slutpunkter, använder IP-adresser eller använder andra inställningar som kan begränsa åtkomsten till det offentliga nätverket till kontot. Azure Cosmos DB-konton bör vara öppna för alla nätverk för att fungera med spegling.

Haveriberedskap och replikeringsfördröjning

I Infrastruktur kan du distribuera innehåll till datacenter i andra regioner än hemregionen för Fabric-klientorganisationen. Mer information finns i multi-geo-stöd.

För ett Azure Cosmos DB-konto med en primär skrivregion och flera läsregioner väljer spegling den Azure Cosmos DB-läsregion som är närmast den region där Infrastrukturresurser har konfigurerats. Det här valet hjälper till att ge replikering med låg latens för spegling.

När du växlar ditt Azure Cosmos DB-konto till en återställningsregion väljer spegling automatiskt den närmaste Azure Cosmos DB-regionen igen.

Kommentar

Spegling stöder inte konton med flera skrivregioner.

Dina Cosmos DB-data som replikeras till OneLake måste konfigureras för att hantera regionomfattande avbrott. Mer information finns i Haveriberedskap i OneLake.

Utforska dina data med spegling

Du kan visa och komma åt speglade data direkt i OneLake. Du kan också sömlöst komma åt speglade data utan ytterligare dataflytt.

Läs mer om hur du kommer åt OneLake med hjälp av ADLS Gen2-API:er eller SDK, OneLake-utforskaren och Azure Storage Explorer.

Du kan ansluta till SQL-analysslutpunkten från verktyg som SQL Server Management Studio (SSMS) eller använda drivrutiner som Microsoft Open Database Connectivity (ODBC) och Java Database Connectivity (JDBC). Mer information finns i SQL Analytics-slutpunktsanslutning.

Du kan också komma åt speglade data med tjänster som:

  • Azure-tjänster som Azure Databricks, Azure HDInsight eller Azure Synapse Analytics
  • Fabric Lakehouse med genvägar för datateknik och datavetenskapsscenarier
  • Andra speglade databaser eller lager i arbetsytan Infrastruktur

Du kan också skapa arkitekturlösningar för medaljonger, rensa och transformera data som hamnar i speglad databas som bronsskikt. Mer information finns i stöd för medaljongarkitektur i Fabric.

Prissättning

Det kostar för närvarande ingen speglingsfunktion eller lagring av speglade data i Infrastrukturresurser under den offentliga förhandsversionen. Beräkningsanvändningen för att köra frågor mot data via SQL, Power BI eller Spark debiteras fortfarande baserat på infrastrukturresursernas kapacitet. Mer information finns i Vanliga frågor och svar: Prissättning.

Om du använder datautforskaren i Fabric-spegling ackumulerar du typiska kostnader baserat på ru-användning (request unit) för att utforska containrarna och köra frågor mot objekten i Azure Cosmos DB-källdatabasen. Funktionen för kontinuerlig säkerhetskopiering i Azure Cosmos DB är en förutsättning för spegling: Standardavgifter för kontinuerlig säkerhetskopiering gäller. Det finns inga ytterligare avgifter för spegling av kontinuerlig säkerhetskopieringsfakturering. Mer information finns i Priser för Azure Cosmos DB.

Gå vidare