Erstellen von Datenspeichern

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel lernen Sie, wie Sie mit Azure Machine Learning-Datenspeichern eine Verbindung mit Azure-Datenspeicherdiensten herstellen.

Voraussetzungen

Hinweis

Machine Learning-Datenspeicher erstellen nicht die zugrunde liegenden Speicherkontoressourcen. Stattdessen verknüpfen sie ein vorhandenes Speicherkonto für die Verwendung durch Machine Learning. Machine Learning-Datenspeicher sind nicht erforderlich. Wenn Sie Zugriff auf die zugrunde liegenden Daten haben, können Sie Speicher-URIs direkt verwenden.

Erstellen eines Azure-Blobdatenspeichers

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Storage Gen2-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Files-Datenspeichers

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Storage Gen1-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Erstellen eines OneLake (Microsoft Fabric)-Datenspeichers (Vorschau)

In diesem Abschnitt werden verschiedene Optionen zum Erstellen eines OneLake-Datenspeichers beschrieben. Der OneLake-Datenspeicher ist Teil von Microsoft Fabric. Derzeit unterstützt Machine Learning die Verbindung mit Microsoft Fabric-Lakehouse-Artefakten im Ordner „Dateien“, die Ordner oder Dateien und Amazon S3-Verknüpfungen umfassen. Weitere Informationen zu Lakehouses finden Sie unter Was ist ein Lakehouse in Microsoft Fabric?.

Die Erstellung von OneLake-Datenspeichern erfordert die folgenden Informationen aus Ihrer Microsoft Fabric-Instanz:

  • Endpunkt
  • Arbeitsbereichs-GUID
  • Artefakt-GUID

Die folgenden Screenshots beschreiben das Abrufen dieser erforderlichen Informationsressourcen aus Ihrer Microsoft Fabric-Instanz:

Screenshot: Aufrufen der Artefakteigenschaften des Microsoft Fabric-Arbeitsbereichsartefaktes auf der Microsoft Fabric-Benutzeroberfläche

Die Werte für „Endpunkt“, „Arbeitsbereichs-GUID“ und „Artefakt-GUID“ finden Sie dann auf der Seite „Eigenschaften“ unter „URL“ und „ABFS-Pfad“:

  • URL-Format: https://{Ihr_OneLake_Endpunkt}/{Ihre_OneLake_Arbeitsbereichs_GUID}/{Ihre_OneLake_Artefakt_GUID}/Files
  • Format des ABFS-Pfads: abfss://{Ihre_OneLake_Arbeitsbereichs_GUID}@{Ihr_OneLake_Endpunkt}/{Ihre_OneLake_Artefakt_GUID}/Files

Screenshot: URL und ABFS-Pfad eines OneLake-Artefakts auf der Microsoft Fabric-Benutzeroberfläche

Erstellen eines OneLake-Datenspeichers

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Nächste Schritte