Zjišťování dat

Azure Databricks poskytuje sadu nástrojů a produktů, které zjednodušují zjišťování datových prostředků, které jsou přístupné prostřednictvím platformy Databricks Data Intelligence Platform. Tento článek obsahuje názorný přehled toho, jak můžete zjistit a zobrazit náhled dat, která už jsou nakonfigurovaná pro přístup ve vašem pracovním prostoru.

Témata v této části se zaměřují na zkoumání datových objektů a datových souborů. Pokud hledáte informace o práci s prostředky, jako jsou poznámkové bloky, dotazy SQL, knihovny a modely, přečtěte si téma Navigace v pracovním prostoru.

Pokud hledáte pokyny k generování souhrnných statistik pro datové sady nebo jiné úlohy spojené s průzkumnou analýzou dat (EDA), přečtěte si téma Průzkumné analýzy dat v Azure Databricks: Nástroje a techniky.

Jak můžete zjišťovat datové prostředky?

Nástroje pro zjišťování dat v Azure Databricks spadají do následujících obecných kategorií:

  • Přehledy, souhrny a vyhledávání s asistencí umělé inteligence
  • Hledání klíčových slov
  • Zkoumání katalogu pomocí uživatelského rozhraní
  • Programové výpisy a zkoumání metadat

Nástroje pro zjišťování dat jsou optimalizované pro data, která se řídí katalogem Unity. Datové prostředky, které nebyly registrovány jako objekty katalogu Unity, nemusí být zjistitelné pomocí některých z těchto přístupů.

Vyhledání dat pomocí uživatelského rozhraní

Průzkumník katalogu poskytuje nástroje pro zkoumání a řízení datových prostředků. K Průzkumníku Ikona katalogu katalogu se dostanete pomocí katalogu na bočním panelu pracovního prostoru. Podívejte se, co je Průzkumník katalogu?

Poznámkové bloky a editor dotazů SQL také poskytují navigátor katalogu pro zkoumání databázových objektů. Kliknutím na ikonu Katalogu v těchto rozhraních rozbalíte nebo sbalíte navigátor katalogu bez opuštění editoru kódu.

Jakmile zjistíte datovou sadu, která vás zajímá, můžete pomocí karty Přehledy zjistit, jak se data používají ve vašem pracovním prostoru. Viz Zobrazení častých dotazů a uživatelů tabulky.

Zkoumání dat prostřednictvím kódu programu

Příkaz můžete použít SHOW pro všechny databázové objekty ke zjišťování prostředků registrovaných v katalogu Unity. K výpisu LIST %fs souborů použijte příkaz, příkaz magic nebo nástroje Databricks.

Viz Prozkoumání úložiště a vyhledání datových souborů a Prozkoumání databázových objektů.

Kontrola komentářů k datům

Komentáře si můžete prohlédnout, abyste se dozvěděli o obsahu datových sad dostupných ve vašem jezeře. Komentáře lze nastavit u datových objektů, včetně katalogů, schémat, tabulek a sloupců. Komentáře můžete zobrazit v Průzkumníku katalogu nebo pomocí DESCRIBE příkazu pro objekt.

Průzkumník katalogu může poskytovat komentáře generované AI pro tabulky, což vlastníkům datových prostředků usnadňuje poskytování bohatého přehledu datových sad. Viz Přidání komentářů generovaných AI do objektů katalogu Unity.

Uživatelé můžou také volitelně poskytnout komentáře k tabulkám a dalším databázovým objektům pomocí markdownu, který se v Průzkumníku katalogu vykresluje. Viz Přidání komentářů k datům a prostředkům AI.

Hledání tabulek v jezeře

Vyhledávací panel v Azure Databricks můžete použít k vyhledání tabulek zaregistrovaných v katalogu Unity. Vyhledávání klíčových slov můžete provést nebo použít sémantické vyhledávání k vyhledání datových sad nebo sloupců, které souvisejí s vaším vyhledávacím dotazem. Hledání vrací jenom výsledky pro tabulky, které máte oprávnění k zobrazení. Prohledávají názvy tabulek, názvy sloupců, komentáře k tabulce a komentáře sloupců. Viz Hledání objektů pracovního prostoru.