Usare l'URI di Azure Data Lake Storage

Il driver del file system Hadoop compatibile con Azure Data Lake Storage è noto con l'identificatore abfs dello schema (File system BLOB di Azure). Coerentemente con altri driver del file system Hadoop, il driver ABFS usa un formato URI per indirizzare file e directory all'interno di un account abilitato per Data Lake Storage.

Sintassi dell'URI

Il driver del file system BLOB di Azure può essere usato con l'endpoint Data Lake Storage di un account anche se tale account non dispone di uno spazio dei nomi gerarchico abilitato. Se l'account di archiviazione non ha uno spazio dei nomi gerarchico, la sintassi dell'URI abbreviato è:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.windows.net/<path>4/<file_name>5
  1. Identificatore di schema: il protocollo abfs viene usato come identificatore di schema. Se si aggiunge un oggetto s alla fine (abfss), il driver client Hadoop ABFS userà sempre Transport Layer Security (TLS) indipendentemente dal metodo di autenticazione scelto. Se si sceglie OAuth come autenticazione, il driver client userà sempre TLS anche se si specifica abfs invece di abfss perché OAuth si basa esclusivamente sul livello TLS. Infine, se si sceglie di usare il metodo precedente di chiave dell'account di archiviazione, il driver client interpreta abfs per indicare che non si vuole usare TLS.

  2. File system: il percorso padre che contiene i file e le cartelle. Si tratta dello stesso valore dei contenitori nel servizio BLOB Archiviazione di Azure.

  3. Nome dell'account: il nome assegnato all'account di archiviazione durante la creazione.

  4. Percorso: una rappresentazione della struttura della directory delimita da una barra (/).

  5. Nome del file: il nome del singolo file. Questo parametro è facoltativo se si punta a una directory.

Tuttavia, se l'account da indirizzare ha uno spazio dei nomi gerarchico, la sintassi dell'URI abbreviato è:

/<path>1/<file_name>2
  1. Percorso: una rappresentazione della struttura della directory delimita da una barra (/).

  2. Nome del file: il nome del singolo file.

Passaggi successivi