Código de depuração usando Databricks Connect para a extensão Databricks para Visual Studio Code

Este artigo descreve como usar a integração Databricks Connect na extensão Databricks para Visual Studio Code para executar e depurar arquivos Python (.py) individuais. Consulte O que é a extensão Databricks para Visual Studio Code?.

A integração do Databricks Connect também permite executar e depurar células do bloco de anotações. Consulte Executar e depurar células do bloco de anotações com o Databricks Connect usando a extensão Databricks para Visual Studio Code.

Requisitos

Antes de poder usar o Databricks Connect de dentro da extensão Databricks para Visual Studio Code, você deve primeiro atender aos requisitos do Databricks Connect. Esses requisitos incluem coisas como um espaço de trabalho habilitado para Unity Catalog, requisitos de computação e requisitos de versão para sua instalação local do Python.

Ativar um ambiente virtual Python

Ative um ambiente virtual Python para seu projeto Python. Os ambientes virtuais Python ajudam a certificar-se de que o seu projeto está a utilizar versões compatíveis dos pacotes Python e Python (neste caso, o pacote Databricks Connect).

No painel Configuração:

  1. Clique no item vermelho Ativar Ambiente Virtual em Ambiente Python.
  2. Na Paleta de comandos, selecione Venv ou Conda.
  3. Selecione as dependências que deseja instalar, se houver.

Instalar o Databricks Connect

Na visualização Configuração em Ambiente Python:

  1. Clique no botão vermelho Install databricks-connect play.
  2. Anexe um cluster.
    • Se a seção Cluster ainda não estiver configurada na extensão, a seguinte mensagem será exibida: "Anexe um cluster para usar o Databricks Connect". Clique em Anexar Cluster e selecione um cluster que atenda aos requisitos do Databricks Connect.
    • Se a seção Cluster estiver configurada, mas o cluster não for compatível com o Databricks Connect, clique no botão vermelho Databricks Connect desabilitado , clique em Anexar Cluster e selecione um cluster compatível.
  3. Se o pacote Databricks Connect (e suas dependências) ainda não estiver instalado, a seguinte mensagem será exibida: "Para depuração interativa e preenchimento automático, você precisa do Databricks Connect. Gostaria de instalá-lo no ambiente <environment-name>." Clique em Install (Instalar).
  4. Na barra de status do Visual Studio Code, se o botão vermelho Databricks Connect disabled for exibido, clique nele e conclua as instruções na tela para habilitá-lo.
  5. Depois que o botão Databricks Connect ativado for exibido, você estará pronto para usar o Databricks Connect.

Nota

Se você usar o Poetry, poderá sincronizar seus pyproject.toml arquivos e poetry.lock com o pacote Databricks Connect instalado (e suas dependências) executando o seguinte comando. Certifique-se de substituir 13.3.2 pela versão do pacote Databricks Connect que corresponde àquela que foi instalada pela extensão Databricks para Visual Studio Code para seu projeto.

poetry add databricks-connect==13.3.2

Executar ou depurar seu código Python

Depois de ativar o Databricks Connect, execute ou depure seu arquivo Python (.py):

  1. Em seu projeto, abra o arquivo Python que você deseja executar ou depurar.

  2. Defina quaisquer pontos de interrupção de depuração dentro do arquivo Python.

  3. Clique no ícone Executar no Databricks ao lado da lista de guias do editor e, em seguida, clique em Databricks Connect: Depurar arquivo atual.

    Depurar arquivo atual do ícone

    A saída aparece no painel Debug Console .

    Você também pode clicar com o botão direito do mouse no .py arquivo e, em seguida, clicar em Executar no Databricks Databricks>Connect: Depurar arquivo atual.

    Depurar arquivo atual do menu de contexto