Veri depoları oluşturma

ŞUNLAR IÇIN GEÇERLIDIR: Azure CLI ml uzantısı v2 (geçerli)Python SDK azure-ai-ml v2 (geçerli)

Bu makalede, Azure Machine Learning veri depolarıyla Azure veri depolama hizmetlerine bağlanmayı öğreneceksiniz.

Önkoşullar

  • Azure aboneliği. Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun. Azure Machine Learning'in ücretsiz veya ücretli sürümünü deneyin.
  • Python için Azure Machine Learning SDK'sı.
  • Machine Learning çalışma alanı.

Not

Machine Learning veri depoları, temel alınan depolama hesabı kaynaklarını oluşturmaz. Bunun yerine, Machine Learning kullanımı için mevcut bir depolama hesabını bağlar. Machine Learning veri depoları gerekli değildir. Temel alınan verilere erişiminiz varsa depolama URI'lerini doğrudan kullanabilirsiniz.

Azure Blob veri deposu oluşturma

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Azure Data Lake Storage 2. Nesil veri deposu oluşturma

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Azure Dosyalar veri deposu oluşturma

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Azure Data Lake Storage 1. Nesil veri deposu oluşturma

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

OneLake (Microsoft Fabric) veri deposu oluşturma (önizleme)

Bu bölümde OneLake veri deposu oluşturmaya yönelik çeşitli seçenekler açıklanmaktadır. OneLake veri deposu Microsoft Fabric'in bir parçasıdır. Machine Learning şu anda klasörleri veya dosyaları ve Amazon S3 kısayollarını içeren "Dosyalar" klasöründeki Microsoft Fabric lakehouse yapıtlarına bağlantıyı destekler. Göl evleri hakkında daha fazla bilgi için bkz . Microsoft Fabric'te göl evi nedir?.

OneLake veri deposu oluşturma işlemi, Microsoft Fabric örneğinizden aşağıdaki bilgileri gerektirir:

  • Uç nokta
  • Çalışma Alanı GUID'i
  • Yapıt GUID'i

Aşağıdaki ekran görüntüleri, bu gerekli bilgi kaynaklarının Microsoft Fabric örneğinizden alınmasını açıklar.

Microsoft Fabric kullanıcı arabiriminde Microsoft Fabric çalışma alanı yapıtlarının yapıt özelliklerine tıklamayı gösteren ekran görüntüsü.

Ardından "Özellikler" sayfasında "URL" ve "ABFS yolu" içinde "Endpoint", "Workspace GUID" ve "Artifact GUID" değerlerini bulacaksınız:

  • URL biçimi: https://{your_one_lake_endpoint}/{your_one_lake_workspace_guid}/{your_one_lake_artifact_guid}/Dosyalar
  • ABFS yol biçimi: abfss://{your_one_lake_workspace_guid}@{your_one_lake_endpoint}/{your_one_lake_artifact_guid}/Dosyalar

Microsoft Fabric kullanıcı arabiriminde OneLake yapıtı url'sini ve ABFS yolunu gösteren ekran görüntüsü.

OneLake veri deposu oluşturma

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX", #{your_one_lake_workspace_guid}
    endpoint="msit-onelake.dfs.fabric.microsoft.com" #{your_one_lake_endpoint}
    artifact = OneLakeArtifact(
        name="XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX/Files", #{your_one_lake_artifact_guid}/Files
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Sonraki adımlar