Nätverksrekommendationer för Lakehouse Federation

Den här artikeln innehåller vägledning för att konfigurera en fungerande nätverkssökväg mellan dina Azure Databricks-kluster eller SQL-lager och det externa databassystem som du ansluter till med Hjälp av Lakehouse Federation.

Tänk på följande viktiga information:

  • All nätverkstrafik sker direkt mellan Azure Databricks-kluster (eller SQL-lager) och det externa databassystemet. Varken Unity Catalog eller Azure Databricks-kontrollplanet finns på nätverkssökvägen.
  • Azure Databricks-beräkning (dvs. kluster och SQL-lager) distribueras alltid i molnet, men det externa databassystemet kan finnas lokalt eller finnas på valfri molnleverantör, så länge det finns en fungerande nätverkssökväg mellan din Azure Databricks-beräkning och den externa databasen.
  • Om du har begränsningar för inkommande eller utgående nätverk för antingen Azure Databricks-beräkning eller det externa databassystemet kan du läsa följande avsnitt för allmän vägledning som hjälper dig att skapa en fungerande nätverkssökväg.

Mer information om nätverk i Azure Databricks-arbetsytor finns i Nätverk.

Databassystem och Azure Databricks-beräkning som båda är tillgängliga från Internet

Anslutningen bör fungera utan någon konfiguration.

Databassystemet har begränsningar för nätverksåtkomst

Om det externa databassystemet har begränsningar för inkommande eller utgående nätverksåtkomst och Azure Databricks-klustret eller SQL-lagret är tillgängligt från Internet konfigurerar du någon av följande nätverkslösningar för att ansluta från klassiska beräkningsresurser:

  • Stabil utgående IP-adress för Azure Databricks-beräkning.

    Från det klassiska beräkningsplanet konfigurerar du en stabil IP-adress med en lastbalanserare, NAT-gateway, internetgateway eller motsvarande och ansluter den till undernätet där Azure Databricks-beräkning distribueras. På så sätt kan beräkningsresursen dela en stabil offentlig IP-adress som kan tillåtas på den externa databassidan.

  • Private Link (endast när den externa databasen finns i samma moln som Azure Databricks-beräkning)

    Från det klassiska beräkningsplanet konfigurerar du en Private Link-anslutning mellan nätverket där databasen distribueras och nätverket där Azure Databricks-beräkning distribueras.

Från det serverlösa beräkningsplanet stöds Azure Private Link för SQL Server-anslutningsappen. Se Steg 3: Skapa privata slutpunktsregler.

Azure Databricks-beräkning har begränsningar för nätverksåtkomst

Om det externa databassystemet är tillgängligt från Internet och Azure Databricks-beräkningen har begränsningar för inkommande eller utgående nätverksåtkomst (vilket endast är möjligt om du befinner dig i ett kundhanterat nätverk) utför du någon av följande konfigurationer:

  • Tillåtlist värdnamnet för den externa databasen i brandväggsreglerna för det undernät där Azure Databricks-beräkning distribueras.

    Om du väljer att tillåtalistning av den externa databasens IP-adress i stället för värdnamn kontrollerar du att den externa databasen har en stabil IP-adress.

  • Private Link (endast när den externa databasen finns i samma moln som Azure Databricks-beräkning)

    Konfigurera en Private Link-anslutning mellan nätverket där databasen distribueras och nätverket där Azure Databricks-beräkning distribueras.

Azure Databricks-beräkning har en anpassad DNS-server

Om det externa databassystemet är tillgängligt från Internet och Azure Databricks-beräkningen har en anpassad DNS-server (vilket endast är möjligt om du är i ett kundhanterat nätverk) lägger du till databassystemets värdnamn till din anpassade DNS-server så att det kan lösas.