Was sind Schemas in Azure Databricks?

In Unity Catalog ist ein Schema ein untergeordnetes Element eines Katalogs und kann Tabellen, Ansichten, Volumes, Modelle und Funktionen enthalten. Schemas verfügen über differenziertere Kategorien der Datenorganisation als Kataloge.

In diesem Artikel wird die Rolle von Schemas in der Azure Databricks-Datenobjekthierarchie in Unity Catalog beschrieben.

Informationen zu Schemas im älteren Hive-Metastore für den lokalen Arbeitsbereich finden Sie unter Datenbankobjekte im Legacy-Hive-Metaspeicher.

Was ist ein Schema?

In Unity Catalog ist ein Schema die zweite Stufe des dreistufigen Namespaces von Unity Catalog (catalog.schema.table-etc).

Objektmodell-Diagramm von Unity Catalog mit Fokus auf dem Schema

Ein Schema strukturiert Daten und KI-Ressourcen in logischen Kategorien, die differenzierter sind als Kataloge. In der Regel stellen sie einen einzelnen Anwendungsfall, ein bestimmtes Projekt oder eine Team-Sandbox dar. Unabhängig vom Kategorietyp sind Schemas ein nützliches Tool zum Verwalten der Datenzugriffskontrolle und zur Verbesserung der Auffindbarkeit von Daten.

Hinweis

In Azure Databricks werden Schemas manchmal als Datenbanken bezeichnet. CREATE DATABASE ist beispielsweise ein Alias für CREATE SCHEMA. Diese Terminologie unterscheidet sich von der einiger relationaler Datenbanksystemen, in denen eine Datenbank eine Sammlung von Schemas ist.

Weitere Informationen zur Datenobjekthierarchie in Unity Catalog finden Sie unter Was sind Datenbankobjekte in Azure Databricks?.

Verwaltete Speicherorte für Schemas

In Unity Catalog können Sie die Daten für alle verwalteten Tabellen und verwalteten Volumes in einem Schema von denen aus anderen Schemas in einem Katalog physisch trennen, indem Sie einen verwalteten Speicherort für das Schema angeben. Das ist vollständig optional. Wenn Sie keinen verwalteten Speicherort für das Schema angeben, befinden sich die Daten am verwalteten Speicherort des Katalogs (und wenn für den Katalog keiner definiert ist, befinden sie sich am verwalteten Speicherort des Metastores). Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog.

Die Datentrennung für externe Tabellen und Volumes hängt davon ab, wie Sie die Daten in Ihrem Cloudspeicher verwalten. Sie ist unabhängig vom verwalteten Speicherort des Schemas.

Nächste Schritte