Köra shell-kommandon i Azure Databricks-webbterminalen
Azure Databricks-webbterminalen är ett bekvämt och mycket interaktivt sätt att köra gränssnittskommandon i ett kommandoradsgränssnitt (CLI), inklusive Databricks CLI-kommandon, för att vidta åtgärder på Databricks-objekt programmatiskt. Det är särskilt användbart för avancerade användningsfall, till exempel batchåtgärder på flera filer, som befintliga användargränssnitt (UIs) kanske inte har fullt stöd för.
Flera användare kan använda webbterminalen på en beräkning.
Du kan använda webbterminalen för att göra följande:
- Gör snabbfilredigeringar med Vim eller Emacs.
- Övervaka resursanvändning med kommandon som
htop
(klusteranvändning) ellernvidia-smi
(GPU-användning). - Kör icke-Spark Python-skript.
- Kör filåtgärder med gränssnittskommandon som
mv
ochmkdir
. - Installera och hantera bibliotek vid beräkning.
- Använd Databricks CLI för att automatisera olika aspekter av Azure Databricks.
Krav
Varning
Azure Databricks proxyservrarar webbterminaltjänsten från port 7681 på beräkningens Spark-drivrutin. Den här webbproxyn är endast avsedd för användning med webbterminalen. Om porten används när beräkningen startar eller om det finns någon form av konflikt kanske webbterminalen inte fungerar som förväntat. Om andra webbtjänster startas på port 7681 kan beräkningsanvändare exponeras för potentiella säkerhetsexploateringar. Varken Databricks eller Microsoft ansvarar för eventuella problem som uppstår vid installation av programvara som inte stöds på en beräkning.
- Webbterminalen är inaktiverad som standard för alla arbetsyteanvändare. Information om hur du aktiverar den finns i Aktivera webbterminalen.
- KAN KOPPLA TILL-behörighet för en beräkning.
- Beräkningen måste använda ett åtkomstläge för Enskild användare eller Ingen isolering delas.
Starta webbterminalen
Du kan starta webbterminalen från sidan med beräkningsinformation eller från en notebook-fil.
Från en notebook-fil
Så här startar du webbterminalen från en notebook-fil:
- Anslut notebook-filen för att beräkna.
- Klicka på ikonen Öppna den nedre panelen längst ned i anteckningsbokens högra sidofält.
- Du kan också klicka på den bifogade listrutan för beräkning, hovra över den anslutna beräkningen och sedan klicka på Webbterminal.
Webbterminalen öppnas i en panel längst ned på skärmen. Med knapparna längst upp till höger i panelen kan du:
- Öppna en ny terminalsession på en ny flik .
- Ladda om en terminalsession .
- Stäng den nedre panelen . Om du vill öppna panelen igen klickar du längst ned i det högra sidofältet.
Från sidan med beräkningsinformation
Så här startar du webbterminalen från sidan med beräkningsinformation:
- Klicka på Beräkning i arbetsytans sidofält.
- På fliken All-purpose compute (All-purpose compute ) klickar du på namnet på beräkningen.
- Starta beräkningen genom att klicka på Start .
- På fliken Appar klickar du på Webbterminal.
En ny flik öppnas med webbterminalens användargränssnitt och Bash-prompten.
Använda webbterminal
I webbterminalen kan du köra kommandon från roten i containern för beräkningsdrivrutinsnoden.
Varje användare kan ha upp till 100 aktiva webbterminalsessioner (flikar) öppna. Inaktiva webbterminalsessioner kan överskrida tidsgränsen och webbterminalwebbprogrammet återansluts, vilket resulterar i en ny gränssnittsprocess. Om du vill behålla Bash-sessionen rekommenderar Databricks att du använder tmux.
Köra Databricks CLI-kommandon
Du kan också använda webbterminalen för att köra Databricks CLI-kommandon. Det tillgängliga CLI:et är alltid den senaste versionen och autentiseringen baseras på den aktuella användaren. Beräkningen måste uppfylla följande krav:
- Klustret måste ha Databricks Runtime 15.0 eller senare installerat.
- Arbetsytan får inte vara aktiverad för Private Link.
Starta webbterminalen och kör följande kommando för att mata ut information om den aktuella användaren:
databricks current-user me
Paketkommandon är också tillgängliga, vilket gör att du kan skapa och hantera databricks-tillgångspaket direkt från webbterminalen på Databricks-arbetsytan. Om du till exempel vill skapa, distribuera och köra ett enkelt paket med hjälp av standardmallen:
Från webbterminalroten går du till arbetsytans startsida och kör
bundle init
:cd /Workspace/Users/someone@example.com databricks bundle init
Acceptera standardmallprompterna och ändra sedan till paketkatalogen och distribuera den:
cd my_project databricks bundle deploy
Du kan visa det distribuerade
my_project
paketet i användargränssnittet för Databricks-arbetsytan.Kör slutligen standardjobbet i paketet:
databricks bundle run my_project_job
Gå till Jobbkörningar för att se det jobb som körs.
Begränsningar
Azure Databricks stöder inte körning av Spark-jobb från webbterminalen.
Azure Databricks-webbterminalen är inte tillgänglig i följande beräkningstyper:
- Jobbberäkning
- Serverlös databearbetning
- Beräkning som startas med miljövariabeluppsättningen
DISABLE_WEB_TERMINAL=true
. - Beräkning startad med åtkomstläge inställt på Delad.
- Compute startade med Spark-konfigurationen
spark.databricks.pyspark.enableProcessIsolation
inställd påtrue
.
Det finns en hård gräns på 12 timmar sedan den första sidinläsningen, varefter alla anslutningar, även om de är aktiva, avslutas. Du kan uppdatera webbterminalen för att återansluta. Databricks rekommenderar att du använder tmux för att bevara shell-sessionen.
ARM-beräkningsresurser kan inte använda webbterminaler för att komma åt arbetsytefiler, inklusive filer i Git-mappar.
Om du aktiverar Docker Container Services inaktiveras webbterminalen.