ルート ディレクトリとは

これまで、Azure Databricks では、一般的なストレージの場所にワークスペース ルート ディレクトリ内のディレクトリが使用されていました。 これらの場所のほとんどは非推奨になりました。

/Volumes は、Unity Catalog ボリューム内のデータに、パスベースのアクセスのエイリアスを提供します。 「ボリュームの作成と操作」を参照してください。

  • /databricks-datasets
  • /user/hive/warehouse
  • /FileStore
  • /databricks-results
  • /databricks/init

/databricks-datasets ディレクトリには何が格納されますか?

/databricks-datasets ディレクトリは、ワークスペース管理者によって設定されたカスタム ワークスペースのアクセス許可によってアクセスが禁止されない限り、すべてのアクセス モード構成で使用できます。

Databricks では、このディレクトリに多数のオープンソース データセットが用意されています。 Databricks により提供されるチュートリアルとデモの多くで、これらのデータセットが参照されますが、それらを使用して Azure Databricks の機能を独自に調べることもできます。

/user/hive/warehouse ディレクトリには何が格納されますか?

これは、hive_metastore に登録されているマネージド テーブルのデータの既定の場所です。

/Filestore ディレクトリには何が格納されますか?

/Filestore ディレクトリには、生成されたプロット用に Azure Databricks UI またはイメージ ファイルを介してアップロードされたデータとライブラリが含まれている場合があります。

これは主にレガシの動作であり、ほとんどの UI オプションはワークスペース ファイルまたはボリュームを使用してファイルをアップロードするようになりました。

/databricks-results ディレクトリには何が格納されますか?

/databricks-results には、クエリの完全な結果をダウンロードすると生成されるファイルが格納されます。

/databricks/init ディレクトリには何が格納されますか?

一部のワークスペースには、従来のグローバル init スクリプトを保持するために使用された、このディレクトリが含まれている場合がありますが、これは使用しないでください。 「グローバル init スクリプト (レガシ)」を参照してください。