Připojení Power BI k Azure Databricks
Microsoft Power BI je služba pro obchodní analýzy, která poskytuje interaktivní vizualizace s možnostmi samoobslužného business intelligence a umožňuje koncovým uživatelům vytvářet sestavy a řídicí panely sami, aniž by museli záviset na zaměstnancích informačních technologií nebo správcích databází.
Když v Power BI používáte Azure Databricks jako zdroj dat, můžete všem podnikovým uživatelům přinést výhody výkonu a technologie Azure Databricks nad rámec datových vědců a datových inženýrů.
Publikování do Power BI Online z Azure Databricks
Při použití Azure Databricks jako zdroje dat v Power BI Online můžete vytvářet datové sady Power BI z tabulek nebo schémat přímo z uživatelského rozhraní Databricks.
Požadavky
Vaše data musí být v katalogu Unity a výpočetní prostředky (cluster) musí být povolené v katalogu Unity. Metastore Hive se v současné době nepodporuje.
Musíte mít licenci Power BI premium (kapacita Premium nebo licence Premium na uživatele).
Zaregistrované aplikaci Entra ID, kterou používáte k publikování z Databricks do Power BI, musíte udělit následující oprávnění:
- Content.Create
- Dataset.ReadWrite.All
- Workspace.ReadWrite.All
- Report.ReadWrite.All
Další informace naleznete v tématu Microsoft Entra Permissions.
Poznámka:
Pro tato oprávnění se obvykle vyžaduje souhlas správce Entra, zejména pro přístup na úrovni pracovního prostoru a datové sady v Power BI. Pokyny najdete v části Kontrola žádostí o souhlas správce.
V nastavení pracovního prostoru Power BI musíte povolit, aby uživatelé mohli upravovat datové modely v služba Power BI (Preview) a upravovat sémantický model po jeho publikování. Sémantický model můžete také upravit pomocí tabulkového editoru tak, že vytvoříte připojení pomocí koncového bodu XMLA.
Pokud potřebujete povolit zápis XML v pracovním prostoru Power BI, postupujte podle pokynů na tomto odkazu .
Pokud váš pracovní prostor Power BI používá privátní propojení, musíte přihlašovací údaje zdroje dat datové sady aktualizovat ručně v Power BI.
Publikování tabulek Azure Databricks do datové sady Power BI
Přihlaste se k pracovnímu prostoru Databricks a kliknutím na Katalog na bočním panelu otevřete Průzkumníka katalogu.
V rozevíracím seznamu v pravém horním rohu vyberte výpočetní prostředek.
Otevřete katalog a vyberte schéma nebo tabulky, které chcete publikovat. Nevybírejte z metastoru Hive ani z katalogu ukázek.
V pravém horním rohu klikněte na Použít s nástroji BI pro schéma nebo Otevřít na řídicím panelu pro tabulku.
Vyberte Publikovat do pracovního prostoru Power BI.
V dialogovém okně Připojit k partnerovi klikněte na Připojit k ID Microsoft Entra a ověřte ho.
V pracovních prostorech Power BI vyberte pracovní prostor Power BI.
V režimu datové sady vyberte DirectQuery nebo Import.
V metodě ověřování v Power BI vyberte OAuth nebo PAT (osobní přístupový token).
Databricks doporučuje používat OAuth, protože umožňuje jemně odstupňované řízení přístupu a auditování na úrovni uživatele. Přihlašovací údaje OAuth možná bude potřeba nakonfigurovat na stránce nastavení datové sady Power BI v části Přihlašovací údaje ke zdroji dat. Pokud vyberete token PAT (Personal Access Token), vytvoří se vaším jménem pat, který Power BI umožní přístup k sémantickému modelu.
V části Název datové sady vyberte Možnost Publikovat jako novou sadu dat nebo Použijte existující datovou sadu.
Pokud zvolíte Použít existující datovou sadu, platí následující:
- Pokud datová sada existuje, nepřepíše se. Aktualizuje pouze nové záznamy v daném schématu.
- Pokud vybraná tabulka není součástí existující datové sady, přidá se.
- Pokud už tabulka byla ve vaší datové sadě a nové sloupce byly přidány po poslední aktualizaci, tyto sloupce se automaticky přidají.
- Pro novou tabulku můžete zvolit jiný model úložiště a vytvořit složený sémantický model.
Pokud máte existující sémantický model, který chcete aktualizovat, zatímco stávající datová připojení zachováte, zvolte Použít existující datovou sadu. Pokud chcete vytvořit novou datovou sadu s novým sémantickým modelem, zvolte Publikovat jako novou sadu dat.
- Pokud datová sada existuje, nepřepíše se. Aktualizuje pouze nové záznamy v daném schématu.
Klikněte na Publikovat do Power BI.
Po publikování datové sady v 10 až 20 sekundách kliknutím na Otevřít Power BI otevřete datovou sadu Power BI na nové kartě.
Funkce a poznámky
- Při publikování schématu obsahujícího více tabulek se publikují všechny tabulky se sloupci. Tabulky bez sloupců se nepublikují.
- Komentáře ke sloupcům tabulky v Azure Databricks se zkopírují do popisu odpovídajících sloupců v Power BI.
- Vztahy cizího klíče se zachovají v publikované datové sadě. Power BI ale podporuje pouze jednu aktivní cestu relace mezi dvěma tabulkami. Pokud ve schématu v Azure Databricks existuje více cest, některé z odpovídajících relací v Power BI jsou nastavené na neaktivní. Později můžete změnit, které relace jsou aktivní nebo neaktivní v zobrazení datového modelu v Power BI.
- Při použití OAuth nebo místní brány dat může být potřeba přihlašovací údaje nakonfigurovat v části Přihlašovací údaje ke zdroji dat na stránce nastavení datové sady Power BI.
Řešení problému
Chyba | Notes |
---|---|
"Požadováno schválení" při prvním spuštění funkce Publikovat do Power BI | Pokud se tato zpráva zobrazí, budete muset před udělením oprávnění této funkci integrace schválit správce Entra. Pokud chcete žádost schválit, obraťte se na svého správce Entra. Pokyny najdete na tomto odkazu . |
PowerBINotLicensedException | Ujistěte se, že máte licenci Power BI Premium. |
Tuto datovou sadu se nám nepovedlo nasadit. Obraťte se na správce kapacity a ujistěte se, že je v nastavení kapacity Power BI Premium povolená podpora čtení a zápisu XMLA a pak to zkuste znovu. Další informace najdete v dokumentaci k produktu v tématu Podpora čtení a zápisu XMLA. | Požádejte správce kapacity Power BI, aby v nastavení kapacity povolil možnosti čtení a zápisu v koncovém bodu XMLA. Pokyny najdete na tomto odkazu . |
Funkce koncového bodu XMLA je zakázaná. Pokud chcete tuto funkci povolit, zapněte funkci Analyzovat v aplikaci Excel v PowerBI.com. | Požádejte správce kapacity Power BI, aby v nastavení kapacity povolil možnosti čtení a zápisu v koncovém bodu XMLA. Pokyny najdete na tomto odkazu . |
CapacityNotActive | Vaše kapacita se může pozastavit. Obraťte se na správce kapacity a zkontrolujte stav kapacity. |
Databáze s názvem '<ccon> ***</ccon> ' již existuje v<ccon> pracovním prostoru </ccon> ***. |
Ujistěte se, že máte oprávnění k vytvoření sémantického modelu. Potom zkuste publikovat do Power BI znovu sémantický model s číslem přírůstkové verze. |
Režim Direct Lake nemůžete použít společně s jinými režimy úložiště ve stejném modelu. Složený model nepodporuje režim Direct Lake. Odeberte nepodporované tabulky nebo je přepněte do režimu Direct Lake. | Vzhledem k tomu, že publikování do Power BI vytvoří sémantický model s režimem Import nebo DirectQuery, nedá se použít k publikování do existující datové sady, která používá režim Direct Lake. Další informace najdete na tomto odkazu . |
Uživatel '<euii> * </euii> ' nemá oprávnění volat metodu Discover. |
Ujistěte se, že publikujete do pracovního prostoru Power BI s režimem licence Premium. V pracovním prostoru nemůžete publikovat v režimu licence Pro. |
Buď uživatel '<euii> </euii> ' nemá oprávnění k vytvoření nového objektu v **, nebo objekt neexistuje. |
V pracovním prostoru Power BI můžete mít roli Čtenář. Zkontrolujte, jestli máte oprávnění k vytvoření sémantického modelu. Další informace najdete na tomto odkazu . |
Nepodařilo se aktualizovat přihlašovací údaje ke zdroji dat: [Microsoft][ThriftExtension] (14) Neočekávaná odpověď ze serveru během připojení HTTP: Vrátila se neautorizovaná nebo zakázaná chybová odpověď, ale nebyla přijata žádná zpráva o vypršení platnosti tokenu." při úpravě přihlašovacích údajů ke zdroji dat v Power BI | Zkontrolujte, jestli je váš pracovní prostor Databricks veřejně přístupný. Pokud váš pracovní prostor používá přístupové seznamy služby Private Link nebo IP, možná budete muset nakonfigurovat místní bránu Power BI. |
Připojení Power BI Desktopu k Azure Databricks
Power BI Desktop můžete připojit ke svým clusterům Azure Databricks a datovým skladům SQL Databricks. Sestavy Power BI můžete publikovat také do služba Power BI a umožnit uživatelům přístup k podkladovým datům Azure Databricks pomocí jednotného přihlašování (SSO) a předávat stejné přihlašovací údaje Microsoft Entra ID, které používají pro přístup k sestavě.
Požadavky
Power BI Desktop 2.85.681.0 nebo novější Pokud chcete používat data spravovaná katalogem Unity s Power BI, musíte použít Power BI Desktop 2.98.683.0 nebo novější (verze vydaná říjen 2021).
Poznámka:
Power BI Desktop vyžaduje Windows. Alternativou pro jiné operační systémy je spuštění Power BI Desktopu na fyzickém hostiteli nebo virtuálním počítači s Windows a pak se k němu připojit z operačního systému.
Pokud používáte verzi Power BI Desktopu nižší než 2.85.681.0, musíte také nainstalovat ovladač ODBC Databricks ve stejném prostředí jako Power BI Desktop.
Osobní přístupový token Azure Databricks nebo přihlašovací údaje účtu Microsoft Entra ID.
Poznámka:
Jako osvědčený postup zabezpečení při ověřování pomocí osobních přístupových tokenů doporučuje Databricks místo uživatelů pracovního prostoru používat osobní přístupové tokeny patřící instančním objektům. Pokud chcete vytvořit tokeny pro instanční objekty, přečtěte si téma Správa tokenů instančního objektu.
Cluster Azure Databricks nebo Databricks SQL Warehouse
Připojení Power BI Desktopu k Azure Databricks pomocí Partnerského připojení
Pomocí Partnerského připojení se můžete připojit ke clusteru nebo SQL Warehouse z Power BI Desktopu několika kliknutími.
Ujistěte se, že váš účet, pracovní prostor a přihlášený uživatel Azure Databricks splňují požadavky pro Partner Connect.
Na bočním panelu klikněte na Partner Connect.
Klikněte na dlaždici Power BI .
V dialogovém okně Připojit k partnerovi v části Compute zvolte název výpočetního prostředku Azure Databricks, který chcete připojit.
Zvolte Stáhnout soubor připojení.
Otevřete stažený soubor připojení, který spustí Power BI Desktop.
V Power BI Desktopu zadejte svoje ověřovací přihlašovací údaje:
- Osobní přístupový token: Zadejte osobní přístupový token Azure Databricks.
- MICROSOFT Entra ID: Klikněte na Přihlásit a pak postupujte podle pokynů na obrazovce.
- Uživatelské jméno a heslo: Nelze použít.
Klepněte na tlačítko Připojit.
Vyberte data Azure Databricks, která se mají dotazovat z Navigátoru Power BI.
Ruční připojení Power BI Desktopu k Azure Databricks
Podle těchto pokynů se v závislosti na zvolené metodě ověřování připojte ke clusteru nebo SQL Warehouse pomocí Power BI Desktopu. Při použití Power BI v režimu DirectQuery se doporučuje sklady SQL Databricks.
Poznámka:
Pokud se chcete připojit rychleji pomocí Power BI Desktop, použijte Partner Connect.
Spusťte aplikaci Power BI Desktop.
Klikněte na Získat data nebo Získat data.>
Začněte kliknutím na Získat data.
Vyhledejte Databricks a klikněte na konektor:
- Azure Databricks
Klepněte na tlačítko Připojit.
Zadejte název hostitele serveru a cestu HTTP.
Vyberte režim připojení k datům. Informace o rozdílu mezi importem a DirectQuery najdete v tématu Použití DirectQuery v Power BI Desktopu.
Klikněte na OK.
Klikněte na metodu ověřování:
- Osobní přístupový token: Zadejte osobní přístupový token Azure Databricks.
- MICROSOFT Entra ID: Klikněte na Přihlásit a pak postupujte podle pokynů na obrazovce.
- Uživatelské jméno a heslo: Nelze použít.
Klepněte na tlačítko Připojit.
Vyberte data Azure Databricks, která se mají dotazovat z Navigátoru Power BI. Pokud je pro váš pracovní prostor povolený katalog Unity, vyberte před výběrem schématu a tabulky katalog.
Použití vlastního dotazu SQL
Konektor Databricks poskytuje Databricks.Query
zdroj dat, který uživateli umožňuje zadat vlastní dotaz SQL.
Postupujte podle kroků popsaných v tématu Připojení pomocí Power BI Desktopu a vytvořte připojení pomocí importu jako režimu připojení k datům.
V navigátoru klikněte pravým tlačítkem myši na nejvyšší položku obsahující vybraný název hostitele a cestu HTTP a kliknutím na Transformovat data otevřete Editor Power Query.
Na panelu funkcí nahraďte název
Databricks.Catalogs
Databricks.Query
funkce a použijte změnu. Tím se vytvoří funkce Power Query, která jako parametr přebírá dotaz SQL.Do pole parametru zadejte dotaz SQL a klikněte na Vyvolat. Tím se dotaz spustí a vytvoří se nová tabulka s výsledky dotazu jako jeho obsahem.
Přístup ke zdroji dat Azure Databricks pomocí služba Power BI
Když publikujete sestavu do služba Power BI, připojíte se k Azure Databricks pomocí osobního přístupového tokenu. V služba Power BI můžete také povolit jednotné přihlašování, aby uživatelé měli přístup k sestavám vytvořeným pomocí režimu úložiště DirectQuery předáním přihlašovacích údajů Microsoft Entra ID do Azure Databricks.
Publikujte sestavu Power BI z Power BI Desktopu do služba Power BI.
Povolte přístup jednotného přihlašování (SSO) k sestavě a podkladovému zdroji dat.
- Přejděte do podkladové datové sady Azure Databricks pro sestavu v služba Power BI, rozbalte přihlašovací údaje ke zdroji dat a klikněte na Upravit přihlašovací údaje.
- V dialogovém okně konfigurace vyberte Čtenáři sestavy, kteří mají přístup pouze k tomuto zdroji dat s vlastními identitami Power BI pomocí Direct Query, a klikněte na Přihlásit se.
Při výběru této možnosti se přístup ke zdroji dat zpracovává pomocí DirectQuery a spravuje se pomocí identity Microsoft Entra ID uživatele, který přistupuje k sestavě. Pokud tuto možnost nevyberete, máte přístup ke zdroji dat Azure Databricks jenom vy, jako uživatel, který sestavu publikoval.
Automatizovaná detekce proxy serveru HTTP
Power BI Desktop verze 2.104.941.0 a vyšší (verze z května 2022) má integrovanou podporu pro detekci konfigurace proxy serveru HTTP pro celý systém Windows.
Power BI Desktop dokáže automaticky rozpoznat a používat konfiguraci proxy serveru HTTP pro celý systém Windows.
Pokud proxy server neposkytuje distribuční bod seznamu CRL (CDP), může Power BI zobrazit následující chybovou zprávu:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
Pokud chcete tuto chybu opravit, proveďte následující kroky:
Pokud soubor
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
neexistuje, vytvořte ho.Do souboru přidejte následující konfiguraci
microsoft.sparkodbc.ini
:[Driver] CheckCertRevocation=0
Konektor Pro sdílení rozdílového sdílení Power BI
Konektor Pro sdílení rozdílového sdílení Power BI umožňuje uživatelům zjišťovat, analyzovat a vizualizovat datové sady sdílené prostřednictvím otevřeného protokolu Delta Sharing . Protokol umožňuje zabezpečenou výměnu datových sad mezi produkty a platformami pomocí REST a cloudového úložiště.
Pokyny k připojení najdete v tématu Power BI: Čtení sdílených dat.
Omezení
- Konektor Azure Databricks podporuje webový proxy server. Nastavení automatického proxy serveru definované v souborech .pac se ale nepodporuje.
- V konektoru
Databricks.Query
Azure Databricks se zdroj dat nepodporuje v kombinaci s režimem DirectQuery. - Data, která konektor Delta Sharing načte, se musí vejít do paměti vašeho počítače. Aby se to zajistilo, konektor omezí počet importovaných řádků na dříve nastavený limit řádků.