Configurazione del cluster per Databricks Connect

Nota

Questo articolo illustra Databricks Connect per Databricks Runtime 13.3 LTS e versioni successive.

Questo articolo elenca le impostazioni di configurazione per le risorse di calcolo di Azure Databricks necessarie per la connessione a Databricks Connect. Queste informazioni si applicano alla versione Python e Scala di Databricks Connect, se non diversamente specificato.

Databricks Connect consente di connettere gli IDE più diffusi, ad esempio Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, server notebook e altre applicazioni personalizzate ai cluster Azure Databricks. Vedere Che cos'è Databricks Connect?.

Requisiti

  • Un account e un'area di lavoro di Azure Databricks in cui è abilitato Unity Catalog. Vedere Configurare e gestire il catalogo unity e Abilitare un'area di lavoro per il catalogo unity.
  • Un cluster Di Azure Databricks con Databricks Runtime 13.3 LTS o versione successiva installato.
  • La versione di Databricks Runtime del cluster deve essere uguale o successiva alla versione del pacchetto Databricks Connect. Databricks consiglia di usare il pacchetto più recente di Databricks Connect corrispondente alla versione di Databricks Runtime. Per usare le funzionalità disponibili nelle versioni successive di Databricks Runtime, è necessario aggiornare il pacchetto Databricks Connect. Per un elenco delle versioni disponibili di Databricks Connect, vedere le note sulla versione di Databricks Connect disponibili. Per le note sulla versione di Databricks Runtime, vedere Versioni e compatibilità delle note sulla versione di Databricks Runtime.
  • Il cluster deve usare una modalità di accesso cluster assegnata o condivisa. Vedere Modalità di accesso.

Convalida a livello di codice

In Databricks Connect 14.3 e versioni successive introduce DatabricksSession.builder validateSession, che esegue una serie di convalide per garantire che vengano soddisfatti i requisiti precedenti.

In Databricks Connect per Python il databricks-connect file binario ha un test sottocomando che esegue lo stesso set di convalide.

Questo comando deve essere eseguito nel terminale con un ambiente Python attivo che include Databricks Connect e con il set di credenziali predefinite configurate. Per configurare queste credenziali, vedere Configurare le proprietà di connessione.

databricks-connect test

Il comando avrà esito negativo con un codice di uscita diverso da zero e un messaggio appropriato quando uno dei requisiti non viene soddisfatto.

Disabilitazione di Databricks Connect

I servizi Databricks Connect (e Spark Connect sottostanti) possono essere disabilitati in qualsiasi cluster specifico.

Per disabilitare il servizio Databricks Connect, impostare la configurazione spark seguente nel cluster.

spark.databricks.service.server.enabled false

Passaggi successivi