sync
grupo de comando
Nota
Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.
O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.
O sync
grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks.
Nota
sync
comandos não podem sincronizar alterações de arquivo de um diretório dentro de um espaço de trabalho remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local.sync
comandos podem sincronizar alterações de arquivo de uma máquina de desenvolvimento local apenas para arquivos de usuário (/Users
) do espaço de trabalho em seu espaço de trabalho do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/
). Para sincronizar alterações de arquivo de uma máquina de desenvolvimento local para DBFS (dbfs:/
) em seu espaço de trabalho do Azure Databricks, use o utilitário de sincronização dbx.
Execute sync
comandos anexando-os ao databricks sync
. Para exibir a ajuda para o sync
comando, execute databricks sync -h
.
Sincronizar incrementalmente alterações de arquivos locais em um diretório remoto
Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, execute o sync
comando, da seguinte maneira:
databricks sync <local-directory-path> <remote-directory-path>
Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivo na pasta nomeada my-folder
dentro do diretório de trabalho atual local, para um caminho específico dentro do espaço de trabalho remoto, execute o seguinte comando:
databricks sync ./my-folder/ /Users/someone@example.com/
Neste exemplo, apenas as alterações de arquivo desde a sync
última execução do comando são sincronizadas com ./Users/someone@example.com/
Por padrão, a URL do espaço de trabalho no perfil do DEFAULT
chamador é usada para determinar o espaço de trabalho remoto com o qual sincronizar.
Sincronize totalmente as alterações de arquivos locais em um diretório remoto
Para executar uma sincronização única, completa e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, independentemente de quando o último sync
comando foi executado, use a --full
opção, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --full
Sincronizar continuamente alterações de arquivos locais em um diretório remoto
Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, use a --watch
opção, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch
A sincronização unidirecional continua até que o comando seja interrompido a partir do terminal, normalmente pressionando Ctrl + c
ou Ctrl + z
.
A sondagem para possíveis eventos de sincronização acontece uma vez por segundo por padrão. Para alterar esse intervalo, use a --interval
opção juntamente com o número de segundos para sondar seguido pelo caractere s
, por exemplo, por cinco segundos:
databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s
Alterar o formato de saída do progresso da sincronização
As informações de progresso da sincronização são enviadas para o terminal em formato de texto por padrão. Para especificar o formato de saída do progresso da sincronização, use a --output
opção, especificando ( text
o padrão, se --output
não for especificado de outra forma) ou json
, por exemplo:
databricks sync ./my-folder/ /Users/someone@example.com/ --output json