Quais são os diretórios raiz?

O Azure Databricks usou historicamente diretórios no diretório raiz do espaço de trabalho para locais de armazenamento comuns. A maioria desses locais está obsoleta.

/Volumes fornece um alias para acesso baseado em caminho aos dados em volumes do Unity Catalog. Confira Criar e trabalhar com volumes.

  • /databricks-datasets
  • /user/hive/warehouse
  • /FileStore
  • /databricks-results
  • /databricks/init

O que é armazenado no diretório /databricks-datasets?

O diretório /databricks-datasets está disponível em todas as configurações de modo de acesso, a menos que permissões personalizadas do espaço de trabalho definidas pelos administradores do espaço de trabalho impeçam o acesso.

O Databricks fornece vários conjuntos de dados código aberto neste diretório. Muitos dos tutoriais e demonstrações fornecidos pelo Databricks fazem referência a esses conjuntos de dados, mas você também pode usá-los para explorar de maneira independente a funcionalidade do Azure Databricks.

O que é armazenado no diretório /user/hive/warehouse?

Esse é o local padrão para dados de tabelas gerenciadas registradas no hive_metastore.

O que é armazenado no diretório /Filestore?

O /Filestore diretório pode conter dados e bibliotecas carregados por meio da interface do usuário do Azure Databricks ou arquivos de imagem para plotagens geradas.

Esse é principalmente um comportamento herdado, e a maioria das opções de UI agora carregam arquivos usando arquivos de espaço de trabalho ou volumes.

O que é armazenado no diretório /databricks-results?

/databricks-results armazena arquivos gerados ao baixar os resultados completos de uma consulta.

O que é armazenado no diretório /databricks/init?

Alguns espaços de trabalho podem conter esse diretório, que foi usado para armazenar scripts de inicialização globais herdados, que não devem ser usados. Veja Scripts de inicialização globais (herdado).