Mise en réseau

Cet article présente des configurations de mise en réseau pour le déploiement et la gestion des comptes et espaces de travail Azure Databricks.

Remarque

Il n’existe actuellement aucun frais de mise en réseau pour les fonctionnalités serverless. Dans une version ultérieure, il est possible que vous fassiez l’objet d’une facturation. Azure Databricks vous informera à l’avance de toutes modifications de la tarification de mise en réseau.

Vue d’ensemble de l’architecture Azure Databricks

Azure Databricks fonctionne à partir d’un plan de contrôle et d’un plan de calcul.

  • Le plan de contrôle comprend les services back-end qu’Azure Databricks gère dans votre compte Azure Databricks. L’application web se trouve dans le plan de contrôle.
  • Le plan de calcul est l’endroit où vos données sont traitées. Il existe deux types de plans de calcul en fonction du calcul que vous utilisez.
    • Pour les calculs Azure Databricks classiques, les ressources de calcul se trouvent dans votre abonnement Azure dans ce qu’on appelle le plan de calcul classique. Ce terme fait référence au réseau de votre abonnement Azure et à ses ressources. Les ressources de plan de calcul classique se situent dans la même région que votre espace de travail.
    • Pour les calculs serverless, les ressources de calcul serverless s’exécutent dans un plan de calcul serverless dans votre compte Azure Databricks. Les ressources du plan de calcul serverless se situent dans la même région cloud que le plan de calcul classique de votre espace de travail. Vous électionnez cette région lorsque vous créez un espace de travail.

Pour en savoir plus sur l'informatique classique et l’informatique Serverless, consultez Types d'informatique. Pour plus d’informations sur l’architecture, consultez la Vue d’ensemble de l’architecture Azure Databricks.

Sécuriser la connectivité réseau

Azure Databricks fournit un environnement de mise en réseau sécurisé par défaut, mais si votre organisation a des besoins supplémentaires, vous pouvez configurer des fonctionnalités de connectivité réseau entre les différentes connexions réseau indiquées dans le diagramme ci-dessous.

Diagramme de vue d’ensemble de la connectivité réseau

  1. Utilisateurs et applications dans Azure Databricks : vous pouvez configurer des fonctionnalités pour contrôler l’accès et fournir une connectivité privée entre les utilisateurs et leurs espaces de travail Azure Databricks. Consultez l’article Mise en réseau des utilisateurs sur Azure Databricks.
  2. Le plan de contrôle et le plan de calcul classique : les ressources de calcul classiques, telles que les clusters, sont déployées dans votre abonnement Azure et se connectent au plan de contrôle. Vous pouvez utiliser des fonctionnalités de connectivité réseau classiques pour déployer des ressources de plan de calcul classiques dans vos propres réseaux virtuels et activer la connectivité privée des clusters vers le plan de contrôle. Consultez l’article Mise en réseau du plan de calcul classique.
  3. Le plan de calcul serverless et le stockage : vous pouvez configurer des connexions privées et dédiées du calcul serverless au stockage. Consultez l’article Mise en réseau du plan de calcul serverless.

Vous pouvez configurer des fonctionnalités de mise en réseau de stockage Azure, notamment des points de terminaison privés, pour sécuriser la connexion entre le plan de calcul classique et vos ressources Azure. Consultez Accorder à votre espace de travail Azure Databricks l’accès à Azure Data Lake Storage Gen2 et Recommandations de mise en réseau de Lakehouse Federation.

Vous pouvez également activer la prise en charge du pare-feu pour le compte de stockage de l’espace de travail afin de limiter l’accès au compte à partir de réseaux et de connexions autorisés. Consultez Activer la prise en charge du pare-feu pour votre compte de stockage d’espace de travail.

La connectivité entre le plan de contrôle et le plan de calcul serverless est toujours sur le réseau principal Azure et non sur l’Internet public.