Gestire i metastore del catalogo Unity

Questo articolo illustra come aggiornare, eliminare e gestire il comportamento dei metastore di Unity Catalog nell'account Azure Databricks.

Per informazioni sui metastore del catalogo Unity e su come crearli, vedere Creare un metastore del catalogo Unity.

Abilitare un metastore da assegnare automaticamente alle nuove aree di lavoro

Per assegnare automaticamente un metastore del catalogo Unity esistente alle nuove aree di lavoro nell'area del metastore, un amministratore dell'account può abilitare l'assegnazione automatica dell'area di lavoro per il metastore. Se questa impostazione non è selezionata, l'amministratore che crea un'area di lavoro nella stessa area del metastore deve abilitare manualmente l'area di lavoro per Il catalogo unity e selezionare il metastore da un elenco a discesa.

Prima che un amministratore dell'account abiliti questa opzione, deve essere sicuro di comprendere gli effetti seguenti sulle nuove aree di lavoro:

Per abilitare l'assegnazione automatica:

  1. In qualità di amministratore dell'account, passare alla console dell'account Azure Databricks.
  2. Fare clic su Icona catalogo Catalogo.
  3. Selezionare il metastore.
  4. Nella scheda Configurazione, in Assegnazione dell'area di lavoro, selezionare Assegna automaticamente nuove aree di lavoro in <region> questo metastore.
  5. Nella finestra di dialogo di conferma fare clic su Abilita assegnazione automatica.

Aggiungere l'archiviazione gestita a un metastore esistente

L'archiviazione gestita a livello di metastore è facoltativa e non è inclusa per i metastore creati automaticamente. È possibile aggiungere l'archiviazione a livello di metastore al metastore se si preferisce un modello di isolamento dei dati che archivia i dati centralmente per più aree di lavoro. È necessaria l'archiviazione a livello di metastore se si vogliono condividere notebook usando la condivisione delta o se si è un partner di Azure Databricks che usa percorsi di gestione temporanea personali.

Vedere anche Specificare un percorso di archiviazione gestito nel catalogo unity.

Requisiti

  • È necessario avere almeno un'area di lavoro collegata al metastore del catalogo Unity.
  • Autorizzazioni di Azure Databricks necessarie:
    • Per creare una posizione esterna, è necessario essere un amministratore o un utente del metastore con i CREATE EXTERNAL LOCATION privilegi e CREATE STORAGE CREDENTIAL .
    • Per aggiungere il percorso di archiviazione alla definizione del metastore, è necessario essere un amministratore dell'account. Per istruzioni sull'abilitazione del ruolo di amministratore dell'account nell'account, vedere Stabilire il primo amministratore dell'account.
  • Autorizzazioni del tenant di Azure necessarie:
    • Autorizzazione per creare un account di archiviazione da usare con Azure Data Lake Storage Gen2. Questo account di archiviazione deve avere uno spazio dei nomi gerarchico. Vedere Creare un account di archiviazione da usare con Azure Data Lake Storage Gen2.
    • Autorizzazione per creare una nuova risorsa per contenere un'identità gestita assegnata dal sistema. A tale scopo, è necessario essere un collaboratore o proprietario di un gruppo di risorse in qualsiasi sottoscrizione nel tenant.

Passaggio 1: Creare il percorso di archiviazione

Seguire le istruzioni in Passaggio 1 (facoltativo): Creare un contenitore di archiviazione per l'archiviazione gestita a livello di metastore e passaggio 2 (facoltativo): creare un'identità gestita per accedere al percorso di archiviazione gestito per creare un contenitore di archiviazione in Azure Data Lake Storage Gen2 e un connettore di accesso di Azure Databricks che contiene un'identità gestita che ha accesso al contenitore di archiviazione.

Passaggio 2: Creare una posizione esterna nel catalogo unity

In questo passaggio viene creata una posizione esterna nel catalogo unity che fa riferimento al percorso di ADLS Gen 2 appena creato.

  1. Creare credenziali di archiviazione.

    Le credenziali di archiviazione rappresenteranno l'identità gestita di Azure creata nel passaggio 1: Creare il percorso di archiviazione.

    Seguire le istruzioni in Creare credenziali di archiviazione per la connessione ad Azure Data Lake Storage Gen2.

  2. Creare un percorso esterno che faccia riferimento alle credenziali di archiviazione create nel passaggio precedente e al contenitore di archiviazione DILS Gen 2 creato nel passaggio 1: Creare il percorso di archiviazione.

    Seguire le istruzioni in Creare una posizione esterna per connettere l'archiviazione cloud ad Azure Databricks

  3. Concedere a se stessi il CREATE MANAGED STORAGE privilegio nella posizione esterna.

    1. Fare clic sul nome della posizione esterna per aprire il riquadro dei dettagli.
    2. Nella scheda Autorizzazioni fare clic su Concedi.
    3. Nella finestra di dialogo Concedi in <external location> selezionare se stessi nel campo Entità e selezionare CREATE MANAGED STORAGE.
    4. Fare clic su Concedi.

Passaggio 3: Aggiungere il percorso di archiviazione al metastore

Dopo aver creato una posizione esterna che rappresenta il bucket di archiviazione del metastore, è possibile aggiungerla al metastore.

  1. Come amministratore dell'account, accedere alla console dell'account.

  2. Fare clic su Icona catalogo Catalogo.

  3. Fare clic sul nome del metastore.

  4. Verificare di essere l'amministratore del Metastore.

    In caso contrario, fare clic su Modifica e assegnarsi come amministratore del metastore. È possibile annullare l'assegnazione quando si esegue questa procedura.

  5. Nella scheda Configurazione, accanto al percorso di ADLS Gen 2, fare clic su Imposta.

  6. Nella finestra di dialogo Imposta radice metastore immettere il percorso di ADLS Gen 2 usato per creare il percorso esterno e fare clic su Aggiorna.

    Non è possibile modificare questo percorso dopo averlo impostato.

Aggiungere un amministratore del metastore

Gli amministratori del metastore sono facoltativi, ma in alcune situazioni può essere utile uno per il metastore.Metastore admins are optional, but there are situations where you might want one for your metastore. Vedere Assegnare un amministratore del metastore.

Eliminare un metastore

Se si chiude l'account Azure Databricks o si ha un altro motivo per eliminare l'accesso ai dati gestiti dal metastore di Unity Catalog, è possibile eliminare il metastore.

Avviso

Tutti gli oggetti gestiti dal metastore diventeranno inaccessibili usando le aree di lavoro di Azure Databricks. Questa azione non può essere annullata.

I dati e i metadati della tabella gestiti verranno eliminati automaticamente dopo 30 giorni. I dati delle tabelle esterne nell'archiviazione cloud non sono interessati dall'eliminazione del metastore.

Per eliminare un metastore:

  1. Come amministratore del metastore, accedere alla console dell'account.
  2. Fare clic su Icona catalogo Catalogo.
  3. Fare clic sul nome del metastore.
  4. Nella scheda Configurazione fare clic sul menu a tre pulsanti nell'angolo in alto a destra e selezionare Elimina.
  5. Nella finestra di dialogo di conferma immettere il nome del metastore e fare clic su Elimina.