Ansluta Power BI till Azure Databricks
Microsoft Power BI är en tjänst för affärsanalys som tillhandahåller interaktiva visualiseringar med business intelligence-funktioner med självbetjäning, vilket gör det möjligt för slutanvändare att skapa rapporter och instrumentpaneler själva utan att behöva vara beroende av it-personal eller databasadministratörer.
När du använder Azure Databricks som datakälla med Power BI kan du ge fördelarna med Prestanda och teknik för Azure Databricks utöver dataexperter och datatekniker för alla företagsanvändare.
Publicera till Power BI Online från Azure Databricks
När du använder Azure Databricks som datakälla med Power BI Online kan du skapa Power BI-datauppsättningar från tabeller eller scheman direkt från Databricks-användargränssnittet.
Krav
Dina data måste finnas i Unity Catalog och din beräkning (klustret) måste vara Unity Catalog aktiverad. Hive-metaarkiv stöds inte för närvarande.
Du måste ha en Premium-licens (premiumkapacitet eller premiumlicens per användare).
Du måste bevilja följande behörigheter till den registrerade Entra-ID-appen som du använder för publicering från Databricks till Power BI:
- Content.Create
- Dataset.ReadWrite.All
- Workspace.ReadWrite.All
- Report.ReadWrite.All
Mer information finns i Microsoft Entra-behörigheter.
Kommentar
Entra-administratörsmedgivande krävs vanligtvis för dessa behörigheter, särskilt för åtkomst på arbetsyta och datauppsättningsnivå i Power BI. Mer information finns i Granska begäranden om administratörsmedgivande.
I Power BI-arbetsyteinställningarna måste du aktivera Användare kan redigera datamodeller i Power BI-tjänst (förhandsversion) för att redigera semantikmodellen när den har publicerats. Du kan också redigera den semantiska modellen med tabellredigeraren genom att upprätta en anslutning med hjälp av XMLA-slutpunkten.
Om du behöver aktivera XML-skrivning på Din Power BI-arbetsyta följer du den här länken för instruktioner.
Om din Power BI-arbetsyta använder en privat länk måste du uppdatera datauppsättningens autentiseringsuppgifter för datakällan manuellt i Power BI.
Publicera Azure Databricks-tabeller till en Power BI-datauppsättning
Logga in på databricks-arbetsytan och klicka på Katalog i sidofältet för att öppna Katalogutforskaren.
Välj en beräkningsresurs i listrutan längst upp till höger.
Öppna en katalog och välj schemat eller tabellerna som ska publiceras. Välj inte från ett hive-metaarkiv eller exempelkatalogen.
I det övre högra hörnet klickar du på Använd med BI-verktyg för ett schema eller Öppna i en instrumentpanel för en tabell.
Välj Publicera till Power BI-arbetsyta.
I dialogrutan Anslut till partner klickar du på Anslut till Microsoft Entra-ID för att autentisera.
I Power BI-arbetsytorna väljer du Power BI-arbetsytan.
I Datamängdsläge väljer du antingen DirectQuery eller Import.
I Autentiseringsmetod i Power BI väljer du OAuth eller PAT (personlig åtkomsttoken).
Databricks rekommenderar att du använder OAuth eftersom det möjliggör detaljerad åtkomstkontroll och granskning på användarnivå. OAuth-autentiseringsuppgifter kan behöva konfigureras på sidan Inställningar för Power BI-datauppsättning under autentiseringsuppgifter för datakälla. Om du väljer Personlig åtkomsttoken (PAT) skapas en PAT för din räkning så att Power BI kan komma åt semantikmodellen.
I Datauppsättningsnamn väljer du Publicera som en ny datauppsättning eller Använd en befintlig datauppsättning.
När du väljer Använd en befintlig datauppsättning är följande sant:
- Om datauppsättningen finns skrivs den inte över. Uppdateringar lägger bara till nya poster i ett visst schema.
- Om den valda tabellen inte ingår i den befintliga datauppsättningen läggs den till.
- Om tabellen redan fanns i datauppsättningen och nya kolumner lades till efter den senaste uppdateringen läggs dessa kolumner automatiskt till.
- Du kan välja en annan lagringsmodell för den nya tabellen för att skapa en sammansatt semantisk modell.
Om du har en befintlig semantisk modell som du vill uppdatera medan du håller befintliga dataanslutningar på plats väljer du Använd en befintlig datauppsättning. Om du vill skapa en ny datauppsättning med en ny semantisk modell väljer du Publicera som ny datauppsättning.
- Om datauppsättningen finns skrivs den inte över. Uppdateringar lägger bara till nya poster i ett visst schema.
Klicka på Publicera till Power BI.
Om 10 till 20 sekunder när datauppsättningen publiceras klickar du på Öppna Power BI för att öppna din Power BI-datauppsättning på en ny flik.
Funktioner och anteckningar
- När du publicerar ett schema som innehåller flera tabeller publiceras alla tabeller med kolumner. Tabeller utan kolumner publiceras inte.
- Kommentarer till en tabells kolumner i Azure Databricks kopieras till beskrivningarna av motsvarande kolumner i Power BI.
- Sekundärnyckelrelationer bevaras i den publicerade datamängden. Power BI stöder dock bara en aktiv relationssökväg mellan två tabeller. När flera sökvägar finns i schemat i Azure Databricks är vissa av motsvarande relationer i Power BI inställda på inaktiva. Du kan senare ändra vilka relationer som är aktiva eller inaktiva i datamodellvyn i Power BI.
- När du använder OAuth eller en lokal datagateway kan autentiseringsuppgifter behöva konfigureras under "Autentiseringsuppgifter för datakälla" på sidan inställningar för Power BI-datauppsättning.
Felsökning
Fel | Kommentar |
---|---|
"Godkännande krävs" när publicera till Power BI startas för första gången | Om du ser det här meddelandet behöver du entra-administratörsgodkännande innan du kan bevilja behörigheter till den här integreringsfunktionen. Kontakta entra-administratören för att godkänna begäran. Följ den här länken om du vill ha instruktioner. |
PowerBINotLicensedException | Kontrollera att du har en Power BI Premium-licens. |
Det gick inte att distribuera den här datamängden. Kontakta en kapacitetsadministratör för att kontrollera att XMLA-läs-/skrivstöd är aktiverat i kapacitetsinställningarna för Power BI Premium-kapaciteten och försök sedan igen. Mer information finns i "XMLA-stöd för läsning/skrivning" i produktdokumentationen. | Kontakta power BI-kapacitetsadministratören för att aktivera läs- och skrivfunktioner under XMLA-slutpunkten i kapacitetsinställningarna. Följ den här länken om du vill ha instruktioner. |
XMLA-slutpunktsfunktionen är inaktiverad. Aktivera Funktionen Analysera i Excel i PowerBI.com för att aktivera den här funktionen. | Kontakta power BI-kapacitetsadministratören för att aktivera läs- och skrivfunktioner under XMLA-slutpunkten i kapacitetsinställningarna. Följ den här länken om du vill ha instruktioner. |
CapacityNotActive | Din kapacitet kan ha pausats. Kontakta kapacitetsadministratören för att kontrollera kapacitetsstatusen. |
Databasen med namnet finns<ccon> ***</ccon> redan på arbetsytan<ccon> </ccon> ***. |
Se till att du har behörighet att skapa en semantisk modell. Försök sedan publicera till Power BI igen för att publicera den semantiska modellen med ett inkrementerat versionsnummer. |
Du kan inte använda Direct Lake-läge tillsammans med andra lagringslägen i samma modell. Sammansatt modell stöder inte Direct Lake-läge. Ta bort tabeller som inte stöds eller växla dem till Direct Lake-läge. | Eftersom Publicera till Power BI skapar en semantisk modell med import- eller DirectQuery-läge kan den inte användas för att publicera till en befintlig datauppsättning som använder Direct Lake-läge. Följ den här länken om du vill veta mer. |
<euii> * </euii> Användaren har inte behörighet att anropa metoden Identifiera. |
Se till att du publicerar till en Power BI-arbetsyta med ett Premium-licensläge. Du kan inte publicera till en arbetsyta med ett Pro-licensläge. |
Antingen har användaren<euii> </euii> inte behörighet att skapa ett nytt objekt i **, eller så finns inte objektet. |
Du kan ha rollen Viewer i Power BI-arbetsytan. Kontrollera om du har behörighet att skapa en semantisk modell. Följ den här länken om du vill ha mer information. |
"Det gick inte att uppdatera autentiseringsuppgifterna för datakällan: [Microsoft][ThriftExtension] (14) Oväntat svar från servern under en HTTP-anslutning: Otillåtet/förbjudet felsvar returnerades, men inget meddelande har upphört att gälla." när du redigerar autentiseringsuppgifter för datakälla i Power BI | Kontrollera om databricks-arbetsytan är offentligt tillgänglig. Om din arbetsyta använder privata länk- eller IP-åtkomstlistor kan du behöva konfigurera en lokal Power BI-gateway. |
Ansluta Power BI Desktop till Azure Databricks
Du kan ansluta Power BI Desktop till dina Azure Databricks-kluster och Databricks SQL-lager. Du kan också publicera Power BI-rapporter till Power BI-tjänst och göra det möjligt för användare att komma åt underliggande Azure Databricks-data med enkel inloggning (SSO) och skicka samma Microsoft Entra-ID-autentiseringsuppgifter som de använder för att komma åt rapporten.
Krav
Power BI Desktop 2.85.681.0 eller senare. Om du vill använda data som hanteras av Unity Catalog med Power BI måste du använda Power BI Desktop 2.98.683.0 eller senare (oktober 2021).
Kommentar
Power BI Desktop kräver Windows. Ett alternativ för andra operativsystem är att köra Power BI Desktop på en fysisk värd eller en Windows-baserad virtuell dator och sedan ansluta till den från operativsystemet.
Om du använder en version av Power BI Desktop under 2.85.681.0 måste du också installera Databricks ODBC-drivrutinen i samma miljö som Power BI Desktop.
En personlig åtkomsttoken för Azure Databricks eller dina autentiseringsuppgifter för Ditt Microsoft Entra-ID-konto.
Kommentar
Som bästa säkerhet när du autentiserar med personliga åtkomsttoken rekommenderar Databricks att du använder personliga åtkomsttoken som tillhör tjänstens huvudnamn i stället för användare av arbetsytan. Information om hur du skapar token för tjänstens huvudnamn finns i Hantera token för tjänstens huvudnamn.
Ansluta Power BI Desktop till Azure Databricks med partneranslutning
Du kan använda Partner Connect för att ansluta till ett kluster eller SQL-lager från Power BI Desktop med bara några få klick.
Kontrollera att ditt Azure Databricks-konto, din arbetsyta och den inloggade användaren uppfyller kraven för Partner Connect.
I sidofältet klickar du på Partneranslutning.
Klicka på Power BI-panelen.
I dialogrutan Anslut till partner för Compute väljer du namnet på den Azure Databricks-beräkningsresurs som du vill ansluta till.
Välj Ladda ned anslutningsfil.
Öppna den nedladdade anslutningsfilen, som startar Power BI Desktop.
I Power BI Desktop anger du dina autentiseringsuppgifter:
- Personlig åtkomsttoken: Ange din personliga åtkomsttoken för Azure Databricks.
- Microsoft Entra-ID: Klicka på Logga in och följ sedan anvisningarna på skärmen.
- Användarnamn/lösenord: Ej tillämpligt.
Klicka på Anslut.
Välj de Azure Databricks-data som du vill köra frågor mot från Power BI Navigator.
Ansluta Power BI Desktop till Azure Databricks manuellt
Följ dessa instruktioner, beroende på din valda autentiseringsmetod, för att ansluta till ett kluster eller SQL-lager med Power BI Desktop. Databricks SQL-lager rekommenderas när du använder Power BI i DirectQuery-läge .
Kommentar
Om du vill ansluta snabbare med Power BI Desktop använder du Partner Connect.
Starta Power BI Desktop.
Klicka på Hämta data eller Hämta > data.
Klicka på Hämta data för att komma igång.
Sök efter Databricks och klicka sedan på anslutningsappen:
- Azure Databricks
Klicka på Anslut.
Ange servervärdnamnet och HTTP-sökvägen.
Välj ditt dataanslutningsläge. Information om skillnaden mellan Import och DirectQuery finns i Använda DirectQuery i Power BI Desktop.
Klicka på OK.
Klicka på din autentiseringsmetod:
- Personlig åtkomsttoken: Ange din personliga åtkomsttoken för Azure Databricks.
- Microsoft Entra-ID: Klicka på Logga in och följ sedan anvisningarna på skärmen.
- Användarnamn/lösenord: Ej tillämpligt.
Klicka på Anslut.
Välj de Azure Databricks-data som du vill köra frågor mot från Power BI Navigator. Om Unity Catalog är aktiverat för din arbetsyta väljer du en katalog innan du väljer ett schema och en tabell.
Använda en anpassad SQL-fråga
Databricks-anslutningsappen tillhandahåller datakällan Databricks.Query
som gör att en användare kan tillhandahålla en anpassad SQL-fråga.
Följ stegen som beskrivs i Anslut med Power BI Desktop för att skapa en anslutning med import som dataanslutningsläge.
I Navigatör högerklickar du på det översta objektet som innehåller det valda värdnamnet och HTTP-sökvägen och klickar på Transformera data för att öppna Power Query-redigeraren.
I funktionsfältet ersätter du funktionsnamnet
Databricks.Catalogs
medDatabricks.Query
och tillämpar ändringen. Detta skapar en Power Query-funktion som tar en SQL-fråga som parameter.Ange SQL-frågan i parameterfältet och klicka på Anropa. Detta kör frågan och en ny tabell skapas med frågeresultatet som innehåll.
Få åtkomst till Azure Databricks-datakällan med hjälp av Power BI-tjänst
När du publicerar en rapport till Power BI-tjänst ansluter du till Azure Databricks med en personlig åtkomsttoken. I Power BI-tjänst kan du även aktivera enkel inloggning (SSO) så att användarna kan komma åt rapporter som skapats med DirectQuery-lagringsläge genom att skicka sina Microsoft Entra-ID-autentiseringsuppgifter till Azure Databricks.
Publicera din Power BI-rapport från Power BI Desktop till Power BI-tjänst.
Aktivera enkel inloggning (SSO) åtkomst till rapporten och den underliggande datakällan.
- Gå till den underliggande Azure Databricks-datauppsättningen för rapporten i Power BI-tjänst, expandera autentiseringsuppgifterna för datakällan och klicka på Redigera autentiseringsuppgifter.
- I konfigurationsdialogrutan väljer du Rapportvisningsprogram kan bara komma åt den här datakällan med sina egna Power BI-identiteter med direct query och klickar på Logga in.
Med det här alternativet valt hanteras åtkomsten till datakällan med DirectQuery och hanteras med hjälp av Microsoft Entra-ID-identiteten för den användare som har åtkomst till rapporten. Om du inte väljer det här alternativet är det bara du som användare som publicerade rapporten som har åtkomst till Azure Databricks-datakällan.
Automatisk HTTP-proxyidentifiering
Power BI Desktop version 2.104.941.0 och senare (version maj 2022) har inbyggt stöd för att identifiera HTTP-proxykonfiguration i hela Windows.
Power BI Desktop kan automatiskt identifiera och använda din Windows-systemomfattande HTTP-proxykonfiguration.
Om proxyservern inte tillhandahåller någon CRL-distributionsplats (CDP) kan Power BI visa följande felmeddelande:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
Utför följande steg för att åtgärda det här felet:
Skapa filen
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
om den inte finns.Lägg till följande konfiguration i
microsoft.sparkodbc.ini
filen:[Driver] CheckCertRevocation=0
Anslutningsapp för Power BI Delta-delning
Med Anslutningsappen för Power BI-deltadelning kan användarna identifiera, analysera och visualisera datauppsättningar som delas med dem via öppna protokollet Deltadelning . Protokollet möjliggör säkert utbyte av datamängder mellan produkter och plattformar genom att använda REST och molnlagring.
Anslutningsinstruktioner finns i Power BI: Läsa delade data.
Begränsningar
- Azure Databricks-anslutningsappen stöder webbproxy. Automatiska proxyinställningar som definierats i .pac-filer stöds dock inte.
- I Azure Databricks-anslutningsappen
Databricks.Query
stöds inte datakällan i kombination med DirectQuery-läge. - De data som deltadelningsanslutningsappen läser in måste passa in i datorns minne. För att säkerställa detta begränsar anslutningsappen antalet importerade rader till den radgräns som angavs tidigare.