Che cos'è DBFS?

Il termine DBFS viene usato per descrivere due parti della piattaforma:

  • Radice DBFS
  • Montaggi DBFS

L'archiviazione e l'accesso ai dati tramite i montaggi DBFS radice o DBFS è un modello deprecato e non consigliato da Databricks. Per consigli sull'uso dei file, vedere Usare i file in Azure Databricks.

Che cos'è il file system di Databricks?

Il termine DBFS deriva da Databricks File System, che descrive il file system distribuito usato da Azure Databricks per interagire con l'archiviazione basata sul cloud.

La tecnologia sottostante associata a DBFS fa ancora parte della piattaforma Azure Databricks. Ad esempio, dbfs:/ è uno schema facoltativo durante l'interazione con i volumi del catalogo Unity.

Gli avvisi e le avvertenze precedenti e correnti su DBFS si applicano solo ai montaggi DBFS radice o DBFS.

Come funziona DBFS con Unity Catalog?

Databricks consiglia di usare Unity Catalog per gestire l'accesso a tutti i dati.

Unity Catalog aggiunge i concetti relativi a posizioni esterne, credenziali di archiviazione e volumi per consentire alle organizzazioni di fornire l'accesso con privilegi minimi ai dati nell'archiviazione di oggetti cloud.

Alcune configurazioni di sicurezza forniscono l'accesso diretto alle risorse gestite dal catalogo unity e DBFS, principalmente per le organizzazioni che hanno completato le migrazioni o parzialmente migrate al catalogo unity. Vedere Procedure consigliate per DBFS e Il catalogo unity.

Che cos'è la radice DBFS?

La radice DBFS è una posizione di archiviazione di cui viene effettuato il provisioning durante la creazione dell'area di lavoro nell'account cloud contenente l'area di lavoro di Azure Databricks. Per informazioni dettagliate sulla configurazione e la distribuzione radice di DBFS, vedere la guida introduttiva di Azure Databricks.

Databricks non consiglia di archiviare dati, librerie o script di produzione nella radice DBFS. Vedere Raccomandazioni per l'uso della radice DBFS.

Per configurare le chiavi gestite dal cliente per l'account di archiviazione che include la radice DBFS, vedere Chiavi gestite dal cliente per la radice DBFS.

Per limitare l'accesso di rete all'account di archiviazione che include la radice DBFS, vedere Abilitare il supporto del firewall per l'account di archiviazione dell'area di lavoro.

Montare l'archiviazione di oggetti

Nota

I montaggi DBFS sono deprecati. Databricks consiglia di usare volumi di Unity Catalog. Vedere Che cosa sono i volumi del catalogo Unity?.

Il montaggio dell'archiviazione di oggetti in DBFS consente di accedere agli oggetti nell'archivio oggetti come se fossero presenti nel file system locale. I montaggi archiviano le configurazioni hadoop necessarie per l'accesso all'archiviazione. Per altre informazioni, vedere Montaggio dell'archiviazione di oggetti cloud in Azure Databricks.