Używanie programu Visual Studio Code z usługą Databricks Connect dla języka Python

Uwaga

W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.

W tym artykule opisano sposób używania programu Databricks Connect dla języka Python z programem Visual Studio Code. Usługa Databricks Connect umożliwia łączenie popularnych środowisk IDE, serwerów notesów i innych aplikacji niestandardowych z klastrami usługi Azure Databricks. Zobacz Co to jest usługa Databricks Connect?. Aby zapoznać się z wersją tego artykułu, zobacz Use Visual Studio Code with Databricks Connect for Scala (Używanie programu Visual Studio Code z programem Databricks Connect dla języka Scala).

Uwaga

Przed rozpoczęciem korzystania z usługi Databricks Connect należy skonfigurować klienta Usługi Databricks Connect.

Napiwek

Rozszerzenie Databricks dla programu Visual Studio Code ma już wbudowaną obsługę programu Databricks Connect dla środowiska Databricks Runtime 13.3 LTS i nowszych wersji. Zobacz Debugowanie kodu przy użyciu usługi Databricks Connect dla rozszerzenia usługi Databricks dla programu Visual Studio Code.

Aby używać usługi Databricks Connect z programem Visual Studio Code i językiem Python, postępuj zgodnie z tymi instrukcjami.

  1. Uruchom program Visual Studio Code.

  2. Otwórz folder zawierający środowisko wirtualne języka Python (plik > otwórz folder).

  3. W terminalu programu Visual Studio Code (wyświetl > terminal) aktywuj środowisko wirtualne.

  4. Ustaw bieżący interpreter języka Python na taki, do którego odwołuje się środowisko wirtualne:

    1. Na palecie poleceń (Widok > palety poleceń) wpisz Python: Select Interpreter, a następnie naciśnij Enter.
    2. Wybierz ścieżkę do interpretera języka Python, do którego odwołuje się środowisko wirtualne.
  5. Dodaj do folderu plik kodu języka Python (.py), który zawiera przykładowy kod lub własny kod. Jeśli używasz własnego kodu, musisz co najmniej zainicjować DatabricksSession kod, jak pokazano w przykładowym kodzie.

  6. Aby uruchomić kod, kliknij polecenie Uruchom > bez debugowania w menu głównym. Cały kod w języku Python działa lokalnie, podczas gdy cały kod PySpark obejmujący operacje ramki danych jest uruchamiany w klastrze w zdalnym obszarze roboczym usługi Azure Databricks i uruchamiane odpowiedzi są wysyłane z powrotem do lokalnego obiektu wywołującego.

  7. Aby debugować kod:

    1. Po otwarciu pliku kodu języka Python ustaw wszystkie punkty przerwania, w których kod ma zostać wstrzymany podczas działania.
    2. Kliknij ikonę Uruchom i debuguj na pasku bocznym lub kliknij pozycję Wyświetl > uruchom w menu głównym.
    3. W widoku Uruchamianie i debugowanie kliknij przycisk Uruchom i debuguj.
    4. Postępuj zgodnie z instrukcjami wyświetlanymi na ekranie, aby rozpocząć uruchamianie i debugowanie kodu.

    Cały kod języka Python jest debugowany lokalnie, podczas gdy cały kod PySpark nadal działa w klastrze w zdalnym obszarze roboczym usługi Azure Databricks. Nie można debugować podstawowego kodu aparatu Spark bezpośrednio z klienta.

Aby uzyskać bardziej szczegółowe instrukcje dotyczące uruchamiania i debugowania, zobacz Konfigurowanie i uruchamianie debugera i debugowania języka Python w programie VS Code.