Qu’est-ce que DBFS ?

Le terme DBFS est utilisé pour décrire deux parties de la plateforme :

  • Racine DBFS
  • Les montages DBFS

Le stockage et l’accès aux données à l’aide de la racine DBFS ou des montages DBFS est un modèle déconseillé et non recommandé par Databricks. Pour obtenir des recommandations sur l’utilisation des fichiers, consultez Utiliser des fichiers sur Azure Databricks.

Qu’est-ce que Databricks File System (DBFS) ?

Le terme DBFS provient de Databricks File System, qui décrit le système de fichiers distribué utilisé par Azure Databricks pour interagir avec le stockage cloud.

La technologie sous-jacente associée à DBFS fait toujours partie de la plateforme Azure Databricks. Par exemple, dbfs:/ est un schéma facultatif lors de l’interaction avec les volumes Unity Catalog.

Les avertissements passés et actuels et les mises en garde concernant DBFS s’appliquent uniquement à la racine DBFS ou aux montages DBFS.

Comment DBFS fonctionne-t-il avec Unity Catalog ?

Databricks recommande d’utiliser Unity Catalog pour gérer l’accès à toutes les données.

Unity Catalog ajoute les concepts d’emplacements externes, d’informations d’identification de stockage et de volumes pour aider les organisations à fournir un droit d’accès minimal aux données dans le stockage d’objets cloud.

Certaines configurations de sécurité fournissent un accès direct aux ressources gérées par Unity Catalog et à DBFS, principalement pour les organisations qui ont effectué des migrations ou qui ont partiellement migré vers Unity Catalog. Reportez-vous aux meilleures pratiques pour DBFS et Unity Catalog.

Qu’est-ce que la racine DBFS ?

La racine DBFS est l’emplacement de stockage approvisionné pendant la création d’un espace de travail dans le compte cloud contenant l’espace de travail Azure Databricks. Pour plus d’informations sur la configuration et le déploiement de la racine DBFS, consultez le guide de démarrage rapide pour Azure Databricks.

Databricks ne recommande pas de stocker les données, bibliothèques ou scripts de production dans la racine DBFS. Consultez Recommandations relatives à l’utilisation de la racine DBFS.

Pour configurer les clés gérées par le client pour le compte de stockage qui inclut la racine DBFS, voir Clés gérées par le client pour la racine DBFS.

Pour limiter l’accès réseau au compte de stockage qui inclut la racine DBFS, consultez Activer la prise en charge du pare-feu pour votre compte de stockage d’espace de travail.

Monter un stockage d’objets

Remarque

Les montages DBFS sont déconseillés. Databricks recommande l’utilisation de volumes Unity Catalog. Consultez Présentation des volumes Unity Catalog.

Le montage du stockage d’objets sur DBFS vous permet d’accéder à des objets dans le stockage d’objets comme s’ils étaient sur le système de fichiers local. Les montages stockent les configurations Hadoop nécessaires pour accéder au stockage. Pour plus d’informations, consultez Montage de stockage d’objets cloud sur Azure Databricks.