Konfiguracja klastra dla usługi Databricks Connect

Uwaga

W tym artykule opisano usługę Databricks Connect dla środowiska Databricks Runtime 13.3 LTS lub nowszego.

W tym artykule wymieniono ustawienia konfiguracji dla zasobów obliczeniowych usługi Azure Databricks wymaganych do nawiązania z nimi połączenia w usłudze Databricks Connect. Te informacje dotyczą języków Python i Scala programu Databricks Connect, chyba że określono inaczej.

Usługa Databricks Connect umożliwia łączenie popularnych środowisk IDE, takich jak Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, serwery notesów i inne niestandardowe aplikacje do klastrów usługi Azure Databricks. Zobacz Co to jest usługa Databricks Connect?.

Wymagania

  • Konto i obszar roboczy usługi Azure Databricks z włączonym wykazem aparatu Unity. Zobacz Konfigurowanie wykazu aparatu Unity i zarządzanie nim oraz Włączanie obszaru roboczego dla wykazu aparatu Unity.
  • Klaster usługi Azure Databricks z zainstalowanym środowiskiem Databricks Runtime 13.3 LTS lub nowszym.
  • Wersja środowiska Databricks Runtime klastra musi być równa lub wyższa niż wersja pakietu Databricks Connect. Usługa Databricks zaleca użycie najnowszego pakietu usługi Databricks Connect zgodnego z wersją środowiska Databricks Runtime. Jeśli chcesz używać funkcji dostępnych w nowszych wersjach środowiska Databricks Runtime, musisz uaktualnić pakiet Databricks Connect. Zapoznaj się z informacjami o wersji programu Databricks Connect, aby uzyskać listę dostępnych wersji programu Databricks Connect. Informacje o wersji środowiska Databricks Runtime można znaleźć w temacie Databricks Runtime release notes versions and compatibility (Informacje o wersji i zgodności środowiska Databricks Runtime).
  • Klaster musi używać trybu dostępu klastra Przypisane lub Udostępnione. Zobacz Tryby dostępu.

Walidacja programowa

W programie Databricks Connect w wersji 14.3 lub nowszej wprowadzono ciąg validateSession, który uruchamia serię weryfikacji w DatabricksSession.builder celu zapewnienia spełnienia powyższych wymagań.

W programie Databricks Connect dla języka Python databricks-connect plik binarny ma test podpolecenia, które wykonuje ten sam zestaw weryfikacji.

To polecenie powinno być uruchamiane w terminalu z aktywnym środowiskiem języka Python, które obejmuje usługę Databricks Connect, oraz z zestawem domyślnych poświadczeń skonfigurowanych. Aby skonfigurować te poświadczenia, zobacz Konfigurowanie właściwości połączenia.

databricks-connect test

Polecenie zakończy się niepowodzeniem z kodem zakończenia innym niż zero i odpowiednim komunikatem, gdy którekolwiek z wymagań nie zostaną spełnione.

Wyłączanie usługi Databricks Connect

Usługi Databricks Connect (i bazowe platformy Spark Connect) można wyłączyć w dowolnym klastrze.

Aby wyłączyć usługę Databricks Connect, ustaw następującą konfigurację platformy Spark w klastrze.

spark.databricks.service.server.enabled false

Następne kroki