Qu’est-ce qu’un espace de travail Azure Machine Learning ?

Les espaces de travail sont des lieux de travail de groupe et de collaboration avec des collègues pour créer des artefacts d’apprentissage automatique (Machine Learning). Par exemple, des expériences, des travaux, des jeux de données, des modèles, des composants et des points de terminaison d’inférence. Cet article décrit les espaces de travail et explique comment gérer l’accès à ces espaces de travail et les utiliser pour organiser votre travail.

Prêt à vous lancer ? Créez un espace de travail.

Tâches effectuées dans un espace de travail

Pour les équipes Machine Learning, l’espace de travail est un endroit qui leur permet d’organiser leur travail. Voici quelques-unes des tâches que vous pouvez commencer à partir d’un espace de travail :

  • Créer des travaux : Les travaux sont des exécutions d’apprentissage que vous utilisez pour générer vos modèles. Vous pouvez regrouper des travaux dans desexpériences pour comparer les métriques.
  • Créer des pipelines : Les pipelines sont des flux de travail réutilisables destinés à l’entraînement et la reformation de votre modèle.
  • Inscrire des ressources de données : Des ressources de données facilitent la gestion des données que vous utilisez pour l’apprentissage des modèles et la création de pipelines.
  • Inscrire des modèles ; Une fois que vous avez un modèle que vous souhaitez déployer, vous créez un modèle inscrit.
  • Déployer un modèle : Utilisez le modèle inscrit et un script de scoring pour déployer le modèle.

En plus de regrouper vos résultats d’apprentissage automatique, les espaces de travail hébergent également des configurations de ressources :

  • Les cibles de calcul vous permettent d’exécuter vos expériences.
  • Les magasins de données définissent la manière dont vous et d’autres personnes pouvez vous connecter à des sources de données lors de l’utilisation de ressources de données.
  • Paramètres de sécurité : Mise en réseau, contrôle d’identité et d’accès et paramètres de chiffrement.

Organisation des espaces de travail

Pour les responsables d’équipe et les administrateurs de l’apprentissage automatique, les espaces de travail font office de conteneurs pour la gestion des accès, la gestion des coûts et l’isolation des données. Voici quelques conseils pour organiser les espaces de travail :

  • Utilisez des rôles utilisateur pour la gestion des autorisations dans l’espace de travail entre les utilisateurs. Par exemple, un scientifique des données, un ingénieur Machine Learning ou un administrateur.
  • Attribuer l’accès aux groupes d’utilisateurs : à l’aide de groupes d’utilisateurs Microsoft Entra, vous n’avez pas besoin d’ajouter des utilisateurs individuels à chaque espace de travail et à d’autres ressources auxquelles le même groupe d’utilisateurs doit accéder.
  • Créez un espace de travail par projet : bien qu’un espace de travail puisse être utilisé pour plusieurs projets, sa limitation à un seul projet par espace de travail permet de générer des rapports de coûts au niveau du projet. Il vous permet également de gérer des configurations telles que des magasins de données dans l’étendue de chaque projet.
  • Partagez les ressources Azure : les espaces de travail vous obligent à créer plusieurs ressources associées. Partagez ces ressources entre les espaces de travail pour éviter les étapes de configuration répétitives.
  • Activez le libre-service : précréez et sécurisez les ressources associées en tant qu’administrateur informatique, et utilisez des rôles utilisateur pour permettre aux scientifiques des données de créer des espaces de travail par eux-mêmes.
  • Partagez des ressources : vous pouvez partager des ressources entre des espaces de travail à l’aide des registres Azure Machine Learning.

Comment mon contenu est-il stocké dans un espace de travail ?

Votre espace de travail conserve un historique de toutes les exécutions d’entraînement, y compris les journaux, les métriques, les sorties, les métadonnées de traçabilité et un instantané de vos scripts. Des artefacts sont générés quand vous effectuez des tâches dans Azure Machine Learning. Leurs métadonnées et données sont stockées dans l’espace de travail et dans ses ressources associées.

Ressources associées

Quand vous créez un espace de travail, vous devez apporter d’autres ressources Azure pour stocker vos données. Si vous ne les avez pas fournies, ces ressources sont créées automatiquement par Azure Machine Learning.

  • Compte Stockage Azure. Stocke les artefacts d’apprentissage automatique tels que les journaux des travaux. Par défaut, ce compte de stockage est utilisé lorsque vous chargez des données dans l’espace de travail. Les notebooks Jupyter utilisés avec vos instances de calcul Azure Machine Learning sont également stockés ici.

    Important

    Vous ne pouvez pas utiliser un compte de stockage Azure existant s’il s’agit de :

    • Un compte de type BlobStorage
    • Un compte Premium (Premium_LRS et Premium_GRS)
    • Un compte avec l’espace de noms hiérarchique (utilisé avec Azure Data Lake Storage Gen2).

    Vous pouvez utiliser un stockage Premium ou un espace de noms hiérarchique comme stockage supplémentaire en créant un magasin de données.

    N’activez pas l’espace de noms hiérarchique sur le compte de stockage après une mise à niveau vers un compte v2 universel.

    Si vous apportez un compte de stockage v1 à usage général existant, vous pouvez le mettre à niveau vers la version 2 à usage général une fois l’espace de travail créé.

  • Azure Container Registry (ACR) : Stocke les conteneurs Docker créés lorsque vous générez des environnements personnalisés via Azure Machine Learning. Le déploiement de modèles AutoML et de profil de données déclenche également la création d’environnements personnalisés.

    Les espaces de travail peuvent être créés sans ACR en tant que dépendance si vous n’avez pas besoin de créer des conteneurs Docker personnalisés. Azure Machine Learning peut lire à partir de registres de conteneurs externes.

    ACR sera automatiquement approvisionné lorsque vous générez des images Docker personnalisées. Utilisez le contrôle d’accès en fonction du rôle Azure (Azure RBAC) pour empêcher la génération de conteneurs Docker par le client.

    Important

    Si votre paramètre d’abonnement exige l’ajout de balises aux ressources qu’il contient, ACR créé par Azure Machine Learning échouera, car il est impossible de définir des balises sur ACR.

  • Azure Application Insights. Vous aide à surveiller et à collecter les informations de diagnostic à partir de vos points de terminaison d’inférence.

    Pour plus d’informations, consultez Superviser des points de terminaison en ligne.

  • Azure Key Vault. Stocke les secrets qui sont utilisés par les cibles de calcul, ainsi que d’autres informations sensibles dont l’espace de travail a besoin.

Créer un espace de travail

Il existe plusieurs moyens de créer un espace de travail. Pour commencer, utilisez l’une des options suivantes :

  • Azure Machine Learning studio vous permet de créer rapidement un espace de travail avec des paramètres par défaut.
  • Utilisez le Portail Azure comme interface de type pointer-cliquer avec plus d’options de sécurité.
  • Utilisez l'extension VS Code, si vous travaillez dans Visual Studio Code.

Pour automatiser la création de l’espace de travail à l’aide de vos paramètres de sécurité préférés :

  • Utilisez des API REST directement dans l’environnement de scripts, pour l’intégration de la plateforme ou dans les workfows MLOps.

Outils pour l’interaction et la gestion de l’espace de travail

Une fois votre espace de travail configuré, vous pouvez interagir avec celui-ci comme suit :

Les tâches de gestion de l’espace de travail suivantes sont disponibles dans chaque interface.

Tâche de gestion de l’espace de travail Portail Studio Kit de développement logiciel (SDK) Python Azure CLI VS Code
Créer un espace de travail
Gérer les accès à l’espace de travail
Créer et gérer des ressources de calcul
Créer une instance de calcul

Avertissement

Le déplacement de votre espace de travail Azure Machine Learning vers un autre abonnement, ou le déplacement de l’abonnement propriétaire vers un nouveau locataire, n’est pas pris en charge. En effet, cela peut provoquer des erreurs.

Sous-ressources

Lorsque vous créez des clusters de calcul et des instances de calcul dans Azure Machine Learning, des sous-ressources sont créées.

  • Machines virtuelles : fournissent de la puissance de calcul pour les instances de calcul et les clusters de calcul, que vous utilisez pour exécuter des travaux.
  • Load Balancer : un équilibreur de charge réseau est créé pour chaque instance de calcul et cluster de calcul afin de gérer le trafic même en cas d’arrêt de l’instance/du cluster de calcul.
  • Réseau virtuel : permet aux ressources Azure de communiquer entre elles, avec Internet et d’autres réseaux locaux.
  • Bande passante : encapsule tous les transferts de données sortants entre les régions.

Étapes suivantes

Pour en savoir plus sur la planification d’un espace de travail pour les besoins de votre organisation, consultez Organiser et configurer Azure Machine Learning.

Pour bien démarrer avec Azure Machine Learning, voir :