Creare archivi dati

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Questo articolo illustra come connettersi ai servizi di archiviazione dati di Azure con gli archivi dati di Azure Machine Learning.

Prerequisiti

Nota

Gli archivi dati di Machine Learning non creano le risorse dell'account di archiviazione sottostanti. Collegano invece un account di archiviazione esistente per l'uso di Machine Learning. Gli archivi dati di Machine Learning non sono necessari. Se si ha accesso ai dati sottostanti, è possibile usare direttamente gli URI di archiviazione.

Creare un archivio dati di BLOB di Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Creare un archivio dati di File di Azure

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Creare un archivio dati OneLake (Microsoft Fabric) (anteprima)

Questa sezione descrive varie opzioni per creare un archivio dati di OneLake. L'archivio dati di OneLake fa parte di Microsoft Fabric. Al momento, Machine Learning supporta la connessione agli artefatti di lakehouse di Microsoft Fabric nella cartella “File” che includono cartelle o file e collegamenti ad Amazon S3. Per altre informazioni su lakehouse, vedere Che cos'è un lakehouse in Microsoft Fabric?.

La creazione dell'archivio dati OneLake richiede le informazioni seguenti dall'istanza di Microsoft Fabric:

  • Endpoint
  • GUID dell'area di lavoro
  • GUID dell’artefatto

Gli screenshot seguenti descrivono il recupero di queste risorse informative necessarie dall'istanza di Microsoft Fabric:

Screenshot che mostra come fare clic nelle proprietà degli artefatti dell'artefatto dell'area di lavoro di Microsoft Fabric nell'interfaccia utente di Microsoft Fabric.

Sarà quindi possibile trovare "Endpoint", "GUID area di lavoro" e "GUID artefatto" in "URL" e "Percorso ABFS" dalla pagina "Proprietà":

  • Formato URL: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/File
  • Formato di percorso ABFS: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/File

Screenshot che mostra l'URL e il percorso ABFS di un artefatto OneLake nell'interfaccia utente di Microsoft Fabric.

Creare un archivio dati di OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Passaggi successivi