sync grupo de comando

Nota

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O sync grupo de comandos dentro da CLI do Databricks permite a sincronização unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks.

Nota

  • sync comandos não podem sincronizar alterações de arquivo de um diretório dentro de um espaço de trabalho remoto do Azure Databricks, de volta para um diretório dentro de um sistema de arquivos local.
  • sync comandos podem sincronizar alterações de arquivo de uma máquina de desenvolvimento local apenas para arquivos de usuário (/Users) do espaço de trabalho em seu espaço de trabalho do Azure Databricks. Ele não pode sincronizar com arquivos DBFS (dbfs:/). Para sincronizar alterações de arquivo de uma máquina de desenvolvimento local para DBFS (dbfs:/) em seu espaço de trabalho do Azure Databricks, use o utilitário de sincronização dbx.

Execute sync comandos anexando-os ao databricks sync. Para exibir a ajuda para o sync comando, execute databricks sync -h.

Sincronizar incrementalmente alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, incremental e unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, execute o sync comando, da seguinte maneira:

databricks sync <local-directory-path> <remote-directory-path>

Por exemplo, para fazer uma sincronização incremental, unidirecional e única de todas as alterações de arquivo na pasta nomeada my-folder dentro do diretório de trabalho atual local, para um caminho específico dentro do espaço de trabalho remoto, execute o seguinte comando:

databricks sync ./my-folder/ /Users/someone@example.com/

Neste exemplo, apenas as alterações de arquivo desde a sync última execução do comando são sincronizadas com ./Users/someone@example.com/ Por padrão, a URL do espaço de trabalho no perfil do DEFAULT chamador é usada para determinar o espaço de trabalho remoto com o qual sincronizar.

Sincronize totalmente as alterações de arquivos locais em um diretório remoto

Para executar uma sincronização única, completa e unidirecional de alterações de arquivo em um diretório do sistema de arquivos local para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, independentemente de quando o último sync comando foi executado, use a --full opção, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --full

Sincronizar continuamente alterações de arquivos locais em um diretório remoto

Para ativar a sincronização contínua e unidirecional de alterações de arquivo em um diretório local do sistema de arquivos para um diretório dentro de um espaço de trabalho remoto do Azure Databricks, use a --watch opção, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch

A sincronização unidirecional continua até que o comando seja interrompido a partir do terminal, normalmente pressionando Ctrl + c ou Ctrl + z.

A sondagem para possíveis eventos de sincronização acontece uma vez por segundo por padrão. Para alterar esse intervalo, use a --interval opção juntamente com o número de segundos para sondar seguido pelo caractere s, por exemplo, por cinco segundos:

databricks sync ./my-folder/ /Users/someone@example.com/ --watch --interval 5s

Alterar o formato de saída do progresso da sincronização

As informações de progresso da sincronização são enviadas para o terminal em formato de texto por padrão. Para especificar o formato de saída do progresso da sincronização, use a --output opção, especificando ( text o padrão, se --output não for especificado de outra forma) ou json, por exemplo:

databricks sync ./my-folder/ /Users/someone@example.com/ --output json