Was ist ein Azure Machine Learning-Arbeitsbereich?

Arbeitsbereiche sind Orte, an denen Sie mit Kollegen zusammenarbeiten können, um Artefakte für maschinelles Lernen zu erstellen und gruppenbezogene Tätigkeiten zu erledigen. Beispielsweise Experimente, Aufträge, Datasets, Modelle, Komponenten und Rückschlussendpunkte. In diesem Artikel werden Arbeitsbereiche beschrieben, wie Sie den Zugriff darauf verwalten und wie Sie sie zum Organisieren Ihrer Arbeit verwenden.

Wollen Sie loslegen? Erstellen eines Arbeitsbereichs

Aufgaben, die in einem Arbeitsbereich ausgeführt werden

Für Machine Learning-Teams ist der Arbeitsbereich ein Ort zum Organisieren ihrer Arbeit. Hier finden Sie einige Aufgaben, die Sie von einem Arbeitsbereich aus starten können:

  • Erstellen von Aufträgen: Aufträge sind Trainingsausführungen, mit denen Sie Ihre Modelle erstellen. Sie können Aufträge in Experimenten gruppieren, um Metriken zu vergleichen.
  • Erstellen von Pipelines: Pipelines sind wiederverwendbare Workflows zum Trainieren und erneuten Trainieren Ihres Modells.
  • Registrieren von Datenressourcen: Datenressourcenvereinfachen die Verwaltung der Daten, die Sie für das Modelltraining und die Pipelineerstellung verwenden.
  • Registrieren von Modellen: Wenn Sie über ein Modell verfügen, das Sie bereitstellen möchten, können Sie ein registriertes Modell erstellen.

Neben der Gruppierung Ihrer Ergebnisse vom maschinellen Lernen dienen Arbeitsbereiche auch zum Hosten von Ressourcenkonfigurationen:

  • Computeziele werden verwendet, um Ihre Experimente auszuführen.
  • Datenspeicher definieren, wie Sie und andere Personen bei der Verwendung von Datenressourcen eine Verbindung mit Datenquellen herstellen können.
  • Sicherheitseinstellungen: Netzwerk, Identitäts- und Zugriffssteuerung sowie Verschlüsselungseinstellungen.

Organisieren von Arbeitsbereichen

Für die leitenden Personen und Administrator*innen beim maschinellen Lernen dienen Arbeitsbereiche als Container für die Zugriffs- und Kostenverwaltung sowie die Datenisolation. Hier finden Sie einige Tipps zum Organisieren von Arbeitsbereichen:

  • Verwenden Sie Benutzerrollen für die Berechtigungsverwaltung im Arbeitsbereich zwischen Benutzern. Beispielsweise einer Wissenschaftliche Fachkraft für Daten, einem Machine Learning-Techniker oder einem Administrator.
  • Zuweisen des Zugriff für Benutzergruppen: Wenn Sie Microsoft Entra-Benutzergruppen verwenden, müssen Sie nicht jedem Arbeitsbereich einzelne Benutzer*innen und andere Ressourcen hinzufügen, auf die diese Benutzer*innen Zugriff benötigen.
  • Ein Arbeitsbereich pro Projekt erstellen: Ein Arbeitsbereich kann zwar für mehrere Projekte verwendet werden, aber die Beschränkung auf ein Projekt pro Arbeitsbereich ermöglicht eine Kostenberichterstellung, die auf Projektebene anfällt. Außerdem können Sie damit Konfigurationen wie Datenspeicher im Rahmen der einzelnen Projekte verwalten.
  • Azure-Ressourcen freigeben: Für Arbeitsbereiche müssen Sie mehrere zugeordnete Ressourcen erstellen. Wenn Sie diese Ressourcen in verschiedenen Arbeitsbereichen freigeben, können Sie sich wiederholende Einrichtungsschritte sparen.
  • Self-Serve aktivieren: Erstellen Sie zugeordneter Ressourcen im Voraus, und sichern Sie diese als IT-Administrator, und verwenden Sie Benutzerrollen, damit Wissenschaftliche Fachkräfte für Daten eigene Arbeitsbereiche erstellen können.
  • Ressourcen freigeben: Sie können Ressourcen zwischen Arbeitsbereichen mithilfe von Azure Machine Learning-Registrierungen freigeben.

Wie werden meine Inhalte in einem Arbeitsbereich gespeichert?

Im Arbeitsbereich wird der Verlauf aller Trainingsläufe mit Protokollen, Metriken, Ausgabe, Metadaten zur Herkunft und einer Momentaufnahme Ihrer Skripts gespeichert. Beim Ausführen von Aufgaben in Azure Machine Learning werden Artefakte generiert. Ihre Metadaten und Daten werden im Arbeitsbereich und in den zugeordneten Ressourcen gespeichert.

Zugeordnete Ressourcen

Wenn Sie einen neuen Arbeitsbereich erstellen, müssen Sie andere Azure-Ressourcen zum Speichern Ihrer Daten verwenden. Wenn sie nicht von Ihnen bereitgestellt wurden, werden diese Ressourcen automatisch von Azure Machine Learning erstellt.

  • Azure Storage-Konto. Dient zum Speichern von Artefakte für maschinelles Lernen wie Auftragsprotokolle. Standardmäßig wird dieses Speicherkonto verwendet, wenn Sie Daten in den Arbeitsbereich hochladen. Jupyter-Notebooks, die mit Ihren Azure Machine Learning-Compute-Instanzen verwendet werden, werden ebenfalls hier gespeichert.

    Wichtig

    Sie können kein vorhandenes Azure Storage-Konto verwenden, wenn es sich um Folgendes handelt:

    • Ein Konto vom Typ BlobStorage
    • Ein Premiumkonto (Premium_LRS und Premium_GRS)
    • Ein Konto mit hierarchischem Namespace (mit Azure Data Lake Storage Gen2 verwendet).

    Sie können Storage Premium oder einen hierarchischen Namespace als zusätzlichen Speicher verwenden, indem Sie einen Datenspeicher erstellen.

    Aktivieren Sie keinen hierarchischen Namespace für das Speicherkonto, nachdem Sie ein Upgrade auf Universell v2 ausgeführt haben.

    Wenn Sie ein vorhandenes Speicherkonto vom Typ „Universell V1“ verwenden, können Sie dieses nach der Erstellung des Arbeitsbereichs auf „Universell V2“ upgraden.

  • Azure Container Registry (ACR). Dient zum Speichern der erstellten Docker-Container, wenn Sie über Azure Machine Learning benutzerdefinierte Umgebungen erstellen. Durch die Bereitstellung von AutoML-Modellen und Datenprofilen wird auch die Erstellung von benutzerdefinierten Umgebungen ausgelöst.

    Arbeitsbereiche können ohne ACR als Abhängigkeit erstellt werden, wenn Sie keine benutzerdefinierten Docker-Container erstellen müssen. Azure Machine Learning kann aus externen Containerregistrierungen lesen.

    ACR wird automatisch bereitgestellt, wenn Sie benutzerdefinierte Docker-Images erstellen. Verwenden Sie die rollenbasierte Zugriffssteuerung (Azure RBAC), um zu verhindern, dass Kunden-Docker-Container erstellt werden.

    Wichtig

    Wenn Ihre Abonnementeinstellung das Hinzufügen von Tags zu darunter liegenden Ressourcen erfordert, wird die von Azure Machine Learning erstellte ACR zu einem Fehler führen, da wir keine Tags für ACR festlegen können.

  • Azure Application Insights Hilft Ihnen, Diagnoseinformationen von Ihren Rückschlussendpunkten zu überwachen und zu sammeln.

    Weitere Informationen finden Sie unter Online-Endpunkte überwachen.

  • Azure Key Vault. Speichert Geheimnisse, die von Computezielen verwendet werden, sowie andere vertrauliche Informationen, die vom Arbeitsbereich benötigt werden.

Erstellen eines Arbeitsbereichs

Es gibt mehrere Möglichkeiten zum Erstellen eines Arbeitsbereichs. Verwenden Sie als Einstieg eine der folgenden Optionen:

So automatisieren Sie die Arbeitsbereichserstellung mithilfe Ihrer bevorzugten Sicherheitseinstellungen

  • Verwenden Sie REST-APIs direkt in der Skriptumgebung, zur Plattformintegration oder in MLOps-Workfows.

Tools für die Interaktion mit und die Verwaltung von Arbeitsbereichen

Nachdem Ihr Arbeitsbereich eingerichtet wurde, können Sie mit ihm auf folgende Weise interagieren:

Die folgenden Verwaltungsaufgaben für Arbeitsbereiche sind bei jeder Schnittstelle verfügbar.

Arbeitsbereichsverwaltungsaufgabe Portal Studio Python SDK Azure CLI VS-Code
Erstellen eines Arbeitsbereichs
Verwalten des Arbeitsbereichszugriffs
Erstellen und Verwalten von Computeressourcen
Erstellen einer Compute-Instanz

Warnung

Das Verschieben des Azure Machine Learning-Arbeitsbereichs in ein anderes Abonnement oder das Verschieben des besitzenden Abonnements in einen neuen Mandanten wird nicht unterstützt. Andernfalls können Fehler auftreten.

Unterressourcen

Wenn Sie in Azure Machine Learning Computecluster und Compute-Instanzen erstellen, werden Unterressourcen erstellt.

  • VMs: stellen Sie Rechenleistung für Compute-Instanzen und Computecluster bereit, die Sie zum Ausführen von Aufträgen verwenden.
  • Lastenausgleich: Für jede Compute-Instanz und jeden Computecluster wird ein Netzwerklastenausgleich erstellt, über den der Datenverkehr auch dann abgewickelt wird, wenn die Compute-Instanz bzw. der Computecluster angehalten wurde.
  • Virtuelles Netzwerk: Ein virtuelles Netzwerk unterstützt Azure-Ressourcen bei der Kommunikation mit anderen Azure-Ressourcen, mit dem Internet und anderen lokalen Netzwerken.
  • Bandbreite: Kapselt regionsübergreifend alle Datenübertragungen.

Nächste Schritte

Weitere Informationen zum Planen eines Arbeitsbereichs für die Anforderungen Ihrer Organisation finden Sie unter Organisieren und Einrichten von Azure Machine Learning.

Informationen zu den ersten Schritten mit Azure Machine Learning finden Sie unter: