Erstellen von Schemas

In diesem Artikel erfahren Sie, wie Sie Schemata in Unity Catalog und dem alten Hive-Metastore erstellen.

Weitere Informationen über Schemata in Azure Databricks, einschließlich eines Vergleichs des Schemaverhaltens in Unity Catalog und Hive-Metastore, finden Sie unter Was sind Schemata in Azure Databricks?.

Voraussetzungen

So erstellen Sie ein Schema in Unity Catalog:

  • Sie benötigen einen Unity Catalog-Metastore, der mit dem Arbeitsbereich verknüpft ist, in dem Sie die Schemaerstellung durchführen.
  • Sie müssen über die USE CATALOG- und CREATE SCHEMA-Datenberechtigungen für den übergeordneten Katalog des Schemas verfügen. Entweder ein Metastoreadministrator oder der Besitzer des Katalogs kann Ihnen diese Berechtigungen erteilen. Wenn Sie ein Metastoreadministrator sind, können Sie sich diese Berechtigungen selbst erteilen.
  • Um einen optionalen verwalteten Speicherort für die Tabellen und Volumes im Schema anzugeben, muss ein externer Speicherort in Unity Catalog definiert sein und Sie müssen über die Berechtigung CREATE MANAGED STORAGE für den externen Speicherort verfügen. Weitere Informationen finden Sie unter Angeben eines verwalteten Speicherorts in Unity Catalog.
  • Der Cluster, den Sie verwenden, um ein Notebook zur Erstellung eines Schemas zu starten, muss einen Unity Catalog-kompatiblen Zugriffsmodus verwenden. Weitere Informationen finden Sie unter Zugriffsmodi. SQL-Warehouses unterstützen Unity Catalog immer.

So erstellen Sie ein Schema im Hive-Metastore:

Erstellen eines Schemas

Um ein Schema in Unity Catalog zu erstellen, können Sie den Catalog Explorer oder SQL-Befehle verwenden. Um ein Schema in Hive-Metastore zu erstellen, müssen Sie SQL-Befehle verwenden.

Katalog-Explorer

  1. Melden Sie sich bei einem Arbeitsbereich an, der mit dem Unity Catalog-Metastore verknüpft ist.
  2. Wählen Sie Katalogsymbol Katalog aus.
  3. Wählen Sie links im Bereich Katalog den Katalog aus, in dem Sie das Schema erstellen möchten.
  4. Klicken Sie im Detailbereich auf Schema erstellen.
  5. Geben Sie dem Schema einen Namen, und fügen Sie einen Kommentar hinzu, der Aufschluss über den Zweck des Schemas gibt.
  6. (Optional:) Geben Sie einen verwalteten Speicherort an. Erfordert die Berechtigung CREATE MANAGED STORAGE für den externen Zielspeicherort. Weitere Informationen finden Sie unter Festlegen eines verwalteten Speicherorts in Unity Catalog und Verwaltete Speicherorte für Schemata.
  7. Klicken Sie auf Erstellen.
  8. Gewähren Sie Berechtigungen für das Schema. Weitere Informationen finden Sie unter Verwalten von Berechtigungen in Unity Catalog.
  9. Klicken Sie auf Speichern.

SQL

  1. Führen Sie die folgenden SQL-Befehle in einem Notebook oder im SQL-Abfrage-Editor aus. Elemente in Klammern sind optional. Sie können SCHEMA oder DATABASE verwenden. Ersetzen Sie folgende Platzhalterwerte:

    • <catalog-name>: Der Name des übergeordneten Katalogs für das Schema. Wenn Sie ein Schema in Hive-Metastore erstellen und sich in einem Unity Catalog-fähigen Arbeitsbereich befinden, verwenden Sie hive_metastore als Katalognamen. Wenn Ihr Arbeitsbereich nicht für Unity Catalog aktiviert ist, geben Sie überhaupt keinen Katalog an.
    • <schema-name>: Ein Name für das Schema.
    • <location-path>: Optionaler Pfad zu einem verwalteten Speicherort. Wird mit MANAGED LOCATION für Unity Catalog und mit LOCATION für Hive-Metastore verwendet. In Unity Catalog müssen Sie über die Berechtigung CREATE MANAGED STORAGE für den externen Speicherort für den von Ihnen angegebenen Pfad verfügen. Weitere Informationen finden Sie unter Festlegen eines verwalteten Speicherorts in Unity Catalog und Verwaltete Speicherorte für Schemata.
    • <comment>: Optionale Beschreibung oder anderer Kommentar.
    • <property-key> = <property-value> [ , ... ]: Optional. Spark-SQL-Eigenschaften und -Werte, die für das Schema festgelegt werden sollen.

    Eine detaillierte Beschreibung der Parameter finden Sie unter CREATE SCHEMA.

    CREATE { DATABASE | SCHEMA } [ IF NOT EXISTS ] <catalog-name>.<schema-name>
        [ MANAGED LOCATION '<location-path>' | LOCATION '<location-path>']
        [ COMMENT <comment> ]
        [ WITH DBPROPERTIES ( <property-key = property_value [ , ... ]> ) ];
    
  2. Gewähren Sie Berechtigungen für das Schema. Informationen zu Unity Catalog-Berechtigungen finden Sie unter Verwalten von Berechtigungen in Unity Catalog.

Sie können auch ein Schema erstellen, indem Sie den Databricks Terraform-Anbieter und databricks_schema verwenden. Sie können eine Liste von Schema-IDs mithilfe von databricks_schemas abrufen.

Nächste Schritte