OneLake, OneDrive för data

OneLake är en enda, enhetlig, logisk datasjö för hela organisationen. En datasjö bearbetar stora mängder data från olika källor. Precis som OneDrive levereras OneLake automatiskt med varje Microsoft Fabric-klientorganisation och är utformad för att vara den enda platsen för alla dina analysdata. OneLake ger kunder:

  • En datasjö för hela organisationen
  • En kopia av data för användning med flera analysmotorer

En datasjö för hela organisationen

Före OneLake var det lättare för kunder att skapa flera sjöar för olika företagsgrupper i stället för att samarbeta på en enda sjö, även med extra omkostnader för att hantera flera resurser. OneLake fokuserar på att ta bort dessa utmaningar genom att förbättra samarbetet. Varje kundklientorganisation har exakt en OneLake. Det kan aldrig finnas mer än en och om du har Fabric kan det aldrig finnas noll. Varje Fabric-klientorganisation etablerar automatiskt OneLake, utan extra resurser att konfigurera eller hantera.

Styrs som standard med distribuerat ägarskap för samarbete

Begreppet klientorganisation är en unik fördel med en SaaS-tjänst. Att veta var en kunds organisation börjar och slutar ger en naturlig styrnings- och efterlevnadsgräns, som kontrolleras av en klientadministratör. Alla data som hamnar i OneLake styrs som standard. Även om alla data ligger inom de gränser som angetts av klientadministratören är det viktigt att den här administratören inte blir en central gatekeeper som hindrar andra delar av organisationen från att bidra till OneLake.

I en klientorganisation kan du skapa valfritt antal arbetsytor. Med arbetsytor kan olika delar av organisationen distribuera ägarskaps- och åtkomstprinciper. Varje arbetsyta är en del av en kapacitet som är knuten till en viss region och faktureras separat.

Diagram som visar funktionen och strukturen för OneLake.

På en arbetsyta kan du skapa dataobjekt och komma åt alla data i OneLake via dataobjekt. På samma sätt som Office lagrar Word-, Excel- och PowerPoint-filer i OneDrive lagrar Fabric lakehouses, lager och andra objekt i OneLake. Objekt kan ge skräddarsydda upplevelser för varje persona, till exempel Apache Spark-utvecklarupplevelsen i ett sjöhus.

Mer information om hur du kommer igång med OneLake finns i Skapa ett sjöhus med OneLake.

Öppna på alla nivåer

OneLake är öppen på alla nivåer. OneLake bygger på Azure Data Lake Storage (ADLS) Gen2 och har stöd för alla typer av filer, strukturerade eller ostrukturerade. Alla Fabric-dataobjekt som informationslager och lakehouses lagrar sina data automatiskt i OneLake i Delta Parquet-format. Om en datatekniker läser in data i ett lakehouse med Apache Spark, och en SQL-utvecklare sedan använder T-SQL för att läsa in data i ett fullständigt transaktionellt informationslager, bidrar båda till samma datasjö. OneLake lagrar alla tabelldata i Delta Parquet-format.

OneLake stöder samma ADLS Gen2-API:er och SDK:er för att vara kompatibla med befintliga ADLS Gen2-program, inklusive Azure Databricks. Du kan hantera data i OneLake som om det vore ett stort ADLS-lagringskonto för hela organisationen. Varje arbetsyta visas som en container i lagringskontot och olika dataobjekt visas som mappar i dessa containrar.

Diagram som visar hur du kan komma åt OneLake-data med API:er och SDK:er.

Mer information om API:er och slutpunkter finns i OneLake-åtkomst och API:er. Exempel på OneLake-integreringar med Azure finns i artiklarna Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks och Azure HDInsight .

OneLake-utforskaren för Windows

OneLake är OneDrive för data. Precis som Med OneDrive kan du enkelt utforska OneLake-data från Windows med onelake-utforskaren för Windows. Du kan navigera i alla dina arbetsytor och dataobjekt, enkelt ladda upp, ladda ned eller ändra filer precis som du gör i Office. OneLake-utforskaren förenklar arbetet med datasjöar, vilket gör att även icke-tekniska företagsanvändare kan använda dem.

Mer information finns i OneLake-utforskaren.

En kopia av data

OneLake syftar till att ge dig så mycket värde som möjligt av en enda kopia av data utan dataförflyttning eller duplicering. Du behöver inte längre kopiera data bara för att använda dem med en annan motor eller för att bryta ned silor så att du kan analysera data med data från andra källor.

Genvägar ansluter data mellan domäner utan dataflytt

Med genvägar kan din organisation enkelt dela data mellan användare och program utan att behöva flytta och duplicera information i onödan. När team arbetar oberoende i separata arbetsytor kan du med genvägar kombinera data mellan olika företagsgrupper och domäner till en virtuell dataprodukt för att passa en användares specifika behov.

En genväg är en referens till data som lagras på andra filplatser. De här filplatserna kan finnas på samma arbetsyta eller på olika arbetsytor, inom OneLake eller utanför OneLake i ADLS, S3 eller Dataverse – och fler målplatser kommer snart. Oavsett plats får genvägar filer och mappar att se ut som om de lagras lokalt.

Diagram som visar hur genvägar ansluter data mellan arbetsytor och objekt.

Mer information om hur du använder genvägar finns i OneLake-genvägar.

En kopia av data med flera analysmotorer

Även om program kan ha separation av lagring och databehandling är data ofta optimerade för en enda motor, vilket gör det svårt att återanvända samma data för flera program. Med Fabric lagrar de olika analysmotorerna (T-SQL, Apache Spark, Analysis Services osv.) data i det öppna Delta Parquet-formatet så att du kan använda samma data i flera motorer.

Det finns inte längre något behov av att kopiera data bara för att använda dem med en annan motor. Du kan alltid välja den bästa motorn för det jobb som du försöker utföra. Anta till exempel att du har ett team med SQL-tekniker som skapar ett fullständigt transaktionellt informationslager. De kan använda T-SQL-motorn och all kraften i T-SQL för att skapa tabeller, transformera data och läsa in data till tabeller. Om en dataexpert vill använda dessa data behöver de inte längre gå igenom en speciell Spark/SQL-drivrutin. OneLake lagrar alla data i Delta Parquet-format. Dataexperter kan använda den fulla kraften i Spark-motorn och dess bibliotek med öppen källkod direkt över data.

Företagsanvändare kan skapa Power BI-rapporter direkt ovanpå OneLake med det nya Direct Lake-läget i Analysis Services-motorn. Analysis Services-motorn är det som driver Power BI-semantiska modeller, och den har alltid erbjudit två lägen för åtkomst till data: import och direkt fråga. Direct Lake-läget ger användarna all importhastighet utan att behöva kopiera data och kombinera det bästa av import och direkt fråga. Mer information finns i Direct Lake.

Diagram som visar hur flera objekt och motorer använder samma kopia av data.

Exempeldiagram som visar inläsning av data med Spark, frågor med T-SQL och visning av data i en Power BI-rapport.