DBFS CLI (レガシ)
重要
このドキュメントは廃止され、更新されない可能性があります。
この情報は、レガシ Databricks CLI バージョン 0.18 以前に適用されます。 Databricks では、代わりにバージョン 0.205 以降の新しい Databricks CLI を使うことをお勧めします。 「Databricks CLI について」を参照してください。 お使いの Databricks CLI のバージョンを確認するには、databricks -v
を実行してください。
Databricks CLI バージョン 0.18 以前から Databricks CLI バージョン 0.205 以降に移行する場合は、「Databricks CLI の移行」を参照してください。
Databricks DBFS CLI サブコマンドを databricks fs
(またはエイリアス dbfs
) に追加し、すべての DBFS パスにプレフィックスとして dbfs:/
を付けてこのコマンドを実行します。 これらのサブコマンドは DBFS API を呼び出します。
databricks fs -h
Usage: databricks fs [OPTIONS] COMMAND [ARGS]...
Utility to interact with DBFS. DBFS paths are all prefixed
with dbfs:/. Local paths can be absolute or local.
Options:
-v, --version
-h, --help Show this message and exit.
Commands:
cat Shows the contents of a file. Does not work for directories.
configure
cp Copies files to and from DBFS.
Options:
-r, --recursive
--overwrite Overwrites files that exist already.
ls Lists files in DBFS.
Options:
--absolute Displays absolute paths.
-l Displays full information including size and file type.
mkdirs Makes directories in DBFS.
mv Moves a file between two DBFS paths.
rm Removes files from DBFS.
Options:
-r, --recursive
10,000 個を超えるファイルを一覧表示、移動、または削除する操作では、DBFS CLI を使用しないことを強くお勧めします。
list
操作 (databricks fs ls
) は、約 60 秒後にタイムアウトになります。move
操作 (databricks fs mv
) は約 60 秒後にタイムアウトになり、データの一部が移動される可能性があります。delete
操作 (databricks fs rm
) では、ファイルのバッチが増分削除されます。
このような操作は、ファイル システム ユーティリティ (dbutils.fs) を使用して、クラスターのコンテキストで実行することをお勧めします。 dbutils.fs
では、DBFS REST API の機能スコープをノートブックから使用できます。 ノートブックを使用してこのような操作を実行すると、選択的な削除といった制御や管理が容易になり、定期的なジョブを自動化できる場合もあります。
制限事項
ファイアウォールが有効なストレージ コンテナーで Databricks DBFS CLI を使用することはサポートされていません。 Databricks では、Databricks Connect または az storage の使用が推奨されています。
ファイルのコンテンツを一覧表示する
使用に関するドキュメントを表示するには、databricks fs cat --help
を実行します。
databricks fs cat dbfs:/tmp/my-file.txt
Apache Spark is awesome!
ファイルをコピーする
使用に関するドキュメントを表示するには、databricks fs cp --help
を実行します。
databricks fs cp dbfs:/tmp/your_file.txt dbfs:/parent/child/grandchild/my_file.txt --overwrite
成功すると、このコマンドでは何も表示されません。
ファイルとディレクトリに関する情報を一覧表示する
使用に関するドキュメントを表示するには、databricks fs ls --help
を実行します。
databricks fs ls dbfs:/tmp --absolute -l
file 42408084 dbfs:/tmp/LoanStats.csv 1590005159000
file 40 dbfs:/tmp/file_b.txt 1603991038000
dir 0 dbfs:/tmp/hive 0
dir 0 dbfs:/tmp/mlflow 0
file 385 dbfs:/tmp/multi-line.json 1597770632000
dir 0 dbfs:/tmp/new 0
dir 0 dbfs:/tmp/parent 0
file 243 dbfs:/tmp/test.json 1597770628000
file 40 dbfs:/tmp/test_dbfs.txt 1603989162000
ディレクトリを作成する
使用に関するドキュメントを表示するには、databricks fs mkdirs --help
を実行します。
databricks fs mkdirs dbfs:/tmp/new-dir
成功すると、このコマンドでは何も表示されません。
ファイルを移動する
使用に関するドキュメントを表示するには、databricks fs mv --help
を実行します。
databricks fs mv dbfs:/tmp/my-file.txt dbfs:/parent/child/grandchild/my-file.txt
成功すると、このコマンドでは何も表示されません。
ファイルを削除する
使用に関するドキュメントを表示するには、databricks fs rm --help
を実行します。
databricks fs rm dbfs:/tmp/parent/child/grandchild/my-file.txt
Delete finished successfully.