Datastore Sınıf
Azure Machine Learning depolama hesabı üzerindeki bir depolama soyutlama değerini temsil eder.
Veri depoları çalışma alanlarına eklenir ve Azure depolama hizmetlerine bağlantı bilgilerini depolamak için kullanılır, böylece bunlara ada göre başvurabilirsiniz ve depolama hizmetlerine bağlanmak için kullanılan bağlantı bilgilerini ve gizli diziyi hatırlamanız gerekmez.
Veri deposu olarak kaydedilebilen desteklenen Azure depolama hizmetlerine örnek olarak şunlar verilebilir:
Azure Blob Kapsayıcısı
Azure Dosya Paylaşımı
Azure Data Lake
Azure Data Lake 2. Nesil
Azure SQL Veritabanı
PostgreSQL için Azure Veritabanı
Databricks Dosya Sistemi
MySQL için Azure Veritabanı
Veri depolarını kaydetme, listeleme, alma ve kaldırma gibi yönetim işlemlerini gerçekleştirmek için bu sınıfı kullanın.
Her hizmet için veri depoları bu sınıfın register*
yöntemleriyle oluşturulur. Verilere erişmek için bir veri deposu kullanırken, veri deposuna kayıtlı kimlik bilgilerine bağlı olarak bu verilere erişim izniniz olmalıdır.
Veri depoları ve bunların makine öğrenmesinde nasıl kullanılabildikleri hakkında daha fazla bilgi için aşağıdaki makalelere bakın:
Ada göre bir veri deposu alın. Bu çağrı, veri deposu hizmetine bir istekte bulunur.
- Devralma
-
builtins.objectDatastore
Oluşturucu
Datastore(workspace, name=None)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Çalışma alanı. |
name
|
str, <xref:optional>
Varsayılan veri deposu olan veri deposunun adı Yok olarak ayarlanır ve bu da varsayılan veri deposunun adını alır. Default value: None
|
Açıklamalar
Eğitim gibi makine öğrenmesi görevleri için veri depolarınızdaki verilerle etkileşim kurmak için bir Azure Machine Learning veri kümesi oluşturun. Veri kümeleri, tablosal verileri pandas veya Spark DataFrame'e yükleyen işlevler sağlar. Veri kümeleri ayrıca Azure Blob depolama, Azure Dosyalar, Azure Data Lake Storage 1. Nesil, Azure Data Lake Storage 2. Nesil, Azure SQL Veritabanı ve PostgreSQL için Azure Veritabanı. Veri kümeleriyle eğitim hakkında daha fazla bilgi edinin.
Aşağıdaki örnekte, Azure Blob Kapsayıcısı'na bağlı bir Veri Deposunun nasıl oluşturulacağı gösterilmektedir.
# from azureml.exceptions import UserErrorException
#
# blob_datastore_name='MyBlobDatastore'
# account_name=os.getenv("BLOB_ACCOUNTNAME_62", "<my-account-name>") # Storage account name
# container_name=os.getenv("BLOB_CONTAINER_62", "<my-container-name>") # Name of Azure blob container
# account_key=os.getenv("BLOB_ACCOUNT_KEY_62", "<my-account-key>") # Storage account key
#
# try:
# blob_datastore = Datastore.get(ws, blob_datastore_name)
# print("Found Blob Datastore with name: %s" % blob_datastore_name)
# except UserErrorException:
# blob_datastore = Datastore.register_azure_blob_container(
# workspace=ws,
# datastore_name=blob_datastore_name,
# account_name=account_name, # Storage account name
# container_name=container_name, # Name of Azure blob container
# account_key=account_key) # Storage account key
# print("Registered blob datastore with name: %s" % blob_datastore_name)
#
# blob_data_ref = DataReference(
# datastore=blob_datastore,
# data_reference_name="blob_test_data",
# path_on_datastore="testdata")
Tam örnek şu kaynaktan edinilebilir: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-data-transfer.ipynb
Yöntemler
get |
Ada göre bir veri deposu alın. Bu, oluşturucuyu çağırmakla aynıdır. |
get_default |
Çalışma alanı için varsayılan veri depounu alın. |
register_azure_blob_container |
Azure Blob Kapsayıcısını veri deposuna kaydetme. Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz. |
register_azure_data_lake |
Yeni bir Azure Data Lake Datastore başlatın. Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz. Azure Data Lake 1. Nesil'i Datastore olarak kaydetme örneği için lütfen aşağıya bakın.
|
register_azure_data_lake_gen2 |
Yeni bir Azure Data Lake 2. Nesil Datastore başlatın. Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz. |
register_azure_file_share |
Azure Dosya Paylaşımı'nı veri deposuna kaydetme. SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz |
register_azure_my_sql |
Yeni bir Azure MySQL Veri Deposu başlatın. MySQL veri deposu yalnızca Azure Machine Learning işlem hatlarında DataTransferStep'e giriş ve çıkış olarak DataReference oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz. Azure MySQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın. |
register_azure_postgre_sql |
Yeni bir Azure PostgreSQL Veri Deposu başlatın. Azure PostgreSQL veritabanını Datastore olarak kaydetme örneği için lütfen aşağıya bakın. |
register_azure_sql_database |
Yeni bir Azure SQL veritabanı Veri Deposu başlatın. Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; Hizmet Sorumlusu veya kullanıcı adı + parola kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz. Azure SQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın. |
register_dbfs |
Yeni bir Databricks Dosya Sistemi (DBFS) veri deposu başlatın. DBFS veri deposu yalnızca Giriş olarak DataReference ve Azure Machine Learning işlem hatlarında DatabricksStep çıkışı olarak PipelineData oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz.. |
register_hdfs |
Not Bu deneysel bir yöntemdir ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental. Yeni bir HDFS veri deposu başlatın. |
set_as_default |
Varsayılan veri depoyu ayarlayın. |
unregister |
Veri deposunun kaydını kaldırıyor. temel depolama hizmeti silinmez. |
get
Ada göre bir veri deposu alın. Bu, oluşturucuyu çağırmakla aynıdır.
static get(workspace, datastore_name)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Çalışma alanı. |
datastore_name
Gerekli
|
str, <xref:optional>
Varsayılan veri deposu olan veri deposunun adı Yok olarak ayarlanır ve bu da varsayılan veri deposunun adını alır. |
Döndürülenler
Tür | Description |
---|---|
Bu ad için karşılık gelen veri deposu. |
get_default
Çalışma alanı için varsayılan veri depounu alın.
static get_default(workspace)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Çalışma alanı. |
Döndürülenler
Tür | Description |
---|---|
Çalışma alanı için varsayılan veri deposu |
register_azure_blob_container
Azure Blob Kapsayıcısını veri deposuna kaydetme.
Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.
static register_azure_blob_container(workspace, datastore_name, container_name, account_name, sas_token=None, account_key=None, protocol=None, endpoint=None, overwrite=False, create_if_not_exists=False, skip_validation=False, blob_cache_timeout=None, grant_workspace_access=False, subscription_id=None, resource_group=None)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Çalışma alanı. |
datastore_name
Gerekli
|
Büyük/küçük harfe duyarlı olmayan veri deposunun adı yalnızca alfasayısal karakterler ve _ içerebilir. |
container_name
Gerekli
|
Azure blob kapsayıcısının adı. |
account_name
Gerekli
|
Depolama hesabı adı. |
sas_token
|
str, <xref:optional>
Bir hesap SAS belirteci, varsayılan olarak Yok'tur. Veri okuma için Kapsayıcılar & Nesneleri için en az Liste & Okuma izinlerine ve veri yazma için de Yazma & Ekle izinlerine ihtiyacımız vardır. Default value: None
|
account_key
|
str, <xref:optional>
Depolama hesabınızın erişim anahtarları varsayılan olarak Yok olarak belirlenir. Default value: None
|
protocol
|
str, <xref:optional>
Blob kapsayıcısına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur. Default value: None
|
endpoint
|
str, <xref:optional>
Depolama hesabının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur. Default value: None
|
overwrite
|
bool, <xref:optional>
varolan bir veri deposu üzerine yazar. Veri deposu yoksa bir veri deposu oluşturur ve varsayılan olarak False olur Default value: False
|
create_if_not_exists
|
bool, <xref:optional>
yoksa blob kapsayıcısını oluşturun, varsayılan değer False olur Default value: False
|
skip_validation
|
bool, <xref:optional>
depolama anahtarlarının doğrulanması atlar, varsayılan değer False'tur Default value: False
|
blob_cache_timeout
|
int, <xref:optional>
Bu blob bağlandığında önbellek zaman aşımını şu kadar saniye olarak ayarlayın. Hiçbiri ise, varsayılan olarak zaman aşımı olmaz (bloblar okunduğunda iş süresi boyunca önbelleğe alınır). Default value: None
|
grant_workspace_access
|
bool, <xref:optional>
Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için Bunu True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı yönetilen kimliğini depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network' Default value: False
|
subscription_id
|
str, <xref:optional>
Depolama hesabının abonelik kimliği varsayılan olarak Yok'tur. Default value: None
|
resource_group
|
str, <xref:optional>
Depolama hesabının kaynak grubu varsayılan olarak Yok'tur. Default value: None
|
Döndürülenler
Tür | Description |
---|---|
Blob veri deposu. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
register_azure_data_lake
Yeni bir Azure Data Lake Datastore başlatın.
Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.
Azure Data Lake 1. Nesil'i Datastore olarak kaydetme örneği için lütfen aşağıya bakın.
adlsgen1_datastore_name='adlsgen1datastore'
store_name=os.getenv("ADL_STORENAME", "<my_datastore_name>") # the ADLS name
subscription_id=os.getenv("ADL_SUBSCRIPTION", "<my_subscription_id>") # subscription id of the ADLS
resource_group=os.getenv("ADL_RESOURCE_GROUP", "<my_resource_group>") # resource group of ADLS
tenant_id=os.getenv("ADL_TENANT", "<my_tenant_id>") # tenant id of service principal
client_id=os.getenv("ADL_CLIENTID", "<my_client_id>") # client id of service principal
client_secret=os.getenv("ADL_CLIENT_SECRET", "<my_client_secret>") # the secret of service principal
adls_datastore = Datastore.register_azure_data_lake(
workspace=ws,
datastore_name=aslsgen1_datastore_name,
subscription_id=subscription_id, # subscription id of ADLS account
resource_group=resource_group, # resource group of ADLS account
store_name=store_name, # ADLS account name
tenant_id=tenant_id, # tenant id of service principal
client_id=client_id, # client id of service principal
client_secret=client_secret) # the secret of service principal
static register_azure_data_lake(workspace, datastore_name, store_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, subscription_id=None, resource_group=None, overwrite=False, grant_workspace_access=False)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
store_name
Gerekli
|
ADLS depo adı. |
tenant_id
|
str, <xref:optional>
Verilere erişmek için kullanılan hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği. Default value: None
|
client_id
|
str, <xref:optional>
Verilere erişmek için kullanılan hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği. Default value: None
|
client_secret
|
str, <xref:optional>
Verilere erişmek için kullanılan hizmet sorumlusunun İstemci Gizli Anahtarı. Default value: None
|
resource_url
|
str, <xref:optional>
Data Lake deposunda gerçekleştirilecek işlemleri belirleyen kaynak URL'si ( Yok ise) varsayılan olarak Default value: None
|
authority_url
|
str, <xref:optional>
Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır Default value: None
|
subscription_id
|
str, <xref:optional>
ADLS deposunun ait olduğu aboneliğin kimliği. Default value: None
|
resource_group
|
str, <xref:optional>
ADLS deposunun ait olduğu kaynak grubu. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
grant_workspace_access
|
bool, <xref:optional>
Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için Bunu True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı yönetilen kimliğini depolamanın Okuyucusu olarak ekler. Kabul etmek için depolamanın Sahibi veya Kullanıcı Erişimi Yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network' Default value: False
|
Döndürülenler
Tür | Description |
---|---|
Azure Data Lake Datastore döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
Not
Azure Data Lake Datastore, Azure Machine Learning İşlem Hatlarını kullanarak veri aktarımını ve U-Sql işlerini çalıştırmayı destekler.
Ayrıca, azure machine learning veri kümesi için desteklenen herhangi bir işlemde indirilebilen veya bağlanabilen bir veri kaynağı olarak da kullanabilirsiniz.
register_azure_data_lake_gen2
Yeni bir Azure Data Lake 2. Nesil Datastore başlatın.
Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir. Kimlik bilgisi tabanlı veri erişimi için hizmet sorumlusuna bir veri deposu kaydedebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.
static register_azure_data_lake_gen2(workspace, datastore_name, filesystem, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, overwrite=False, subscription_id=None, resource_group=None, grant_workspace_access=False)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
filesystem
Gerekli
|
Data Lake 2. Nesil dosya sisteminin adı. |
account_name
Gerekli
|
Depolama hesabı adı. |
tenant_id
|
str, <xref:optional>
Hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği. Default value: None
|
client_id
|
str, <xref:optional>
Hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği. Default value: None
|
client_secret
|
str, <xref:optional>
Hizmet sorumlusunun gizli dizisi. Default value: None
|
resource_url
|
str, <xref:optional>
Data Lake Store'da gerçekleştirilecek işlemleri belirleyen kaynak URL'si, varsayılan olarak Default value: None
|
authority_url
|
str, <xref:optional>
Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır Default value: None
|
protocol
|
str, <xref:optional>
Blob kapsayıcısına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur. Default value: None
|
endpoint
|
str, <xref:optional>
Depolama hesabının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
subscription_id
|
str, <xref:optional>
ADLS deposunun ait olduğu aboneliğin kimliği. Default value: None
|
resource_group
|
str, <xref:optional>
ADLS deposunun ait olduğu kaynak grubu. Default value: None
|
grant_workspace_access
|
bool, <xref:optional>
Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için Bunu True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı yönetilen kimliğini depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network' Default value: False
|
Döndürülenler
Tür | Description |
---|---|
Azure Data Lake 2. Nesil Datastore'unu döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
register_azure_file_share
Azure Dosya Paylaşımı'nı veri deposuna kaydetme.
SAS Belirteci veya Depolama Hesabı Anahtarı kullanmayı seçebilirsiniz
static register_azure_file_share(workspace, datastore_name, file_share_name, account_name, sas_token=None, account_key=None, protocol=None, endpoint=None, overwrite=False, create_if_not_exists=False, skip_validation=False)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Büyük/küçük harfe duyarlı olmayan veri deposunun adı yalnızca alfasayısal karakterler ve _ içerebilir. |
file_share_name
Gerekli
|
Azure dosya kapsayıcısının adı. |
account_name
Gerekli
|
Depolama hesabı adı. |
sas_token
|
str, <xref:optional>
Bir hesap SAS belirteci, varsayılan olarak Yok'tur. Veri okuma için Kapsayıcılar & Nesneleri için en az Liste & Okuma izinlerine ve veri yazma için de Yazma & Ekle izinlerine ihtiyacımız vardır. Default value: None
|
account_key
|
str, <xref:optional>
Depolama hesabınızın erişim anahtarları varsayılan olarak Yok olarak belirlenir. Default value: None
|
protocol
|
str, <xref:optional>
Dosya paylaşımına bağlanmak için kullanılacak protokol. Hiçbiri ise, varsayılan olarak https olur. Default value: None
|
endpoint
|
str, <xref:optional>
Dosya paylaşımının uç noktası. Hiçbiri ise, varsayılan olarak core.windows.net olur. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
create_if_not_exists
|
bool, <xref:optional>
Dosya paylaşımı yoksa oluşturulup oluşturulmayacağı. Varsayılan değer False'tur. Default value: False
|
skip_validation
|
bool, <xref:optional>
Depolama anahtarlarını doğrulamanın atlanıp atlanmadığı. Varsayılan değer False'tur. Default value: False
|
Döndürülenler
Tür | Description |
---|---|
Dosya veri deposu. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
register_azure_my_sql
Yeni bir Azure MySQL Veri Deposu başlatın.
MySQL veri deposu yalnızca Azure Machine Learning işlem hatlarında DataTransferStep'e giriş ve çıkış olarak DataReference oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz.
Azure MySQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.
static register_azure_my_sql(workspace, datastore_name, server_name, database_name, user_id, user_password, port_number=None, endpoint=None, overwrite=False, **kwargs)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
server_name
Gerekli
|
MySQL sunucu adı. |
database_name
Gerekli
|
MySQL veritabanı adı. |
user_id
Gerekli
|
MySQL sunucusunun Kullanıcı Kimliği. |
user_password
Gerekli
|
MySQL sunucusunun kullanıcı parolası. |
port_number
|
MySQL sunucusunun bağlantı noktası numarası. Default value: None
|
endpoint
|
str, <xref:optional>
MySQL sunucusunun uç noktası. Hiçbiri ise, varsayılan olarak mysql.database.azure.com olur. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
Döndürülenler
Tür | Description |
---|---|
MySQL veritabanı Veri Deposu'nı döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
mysql_datastore_name="mysqldatastore"
server_name=os.getenv("MYSQL_SERVERNAME", "<my_server_name>") # FQDN name of the MySQL server
database_name=os.getenv("MYSQL_DATBASENAME", "<my_database_name>") # Name of the MySQL database
user_id=os.getenv("MYSQL_USERID", "<my_user_id>") # The User ID of the MySQL server
user_password=os.getenv("MYSQL_USERPW", "<my_user_password>") # The user password of the MySQL server.
mysql_datastore = Datastore.register_azure_my_sql(
workspace=ws,
datastore_name=mysql_datastore_name,
server_name=server_name,
database_name=database_name,
user_id=user_id,
user_password=user_password)
register_azure_postgre_sql
Yeni bir Azure PostgreSQL Veri Deposu başlatın.
Azure PostgreSQL veritabanını Datastore olarak kaydetme örneği için lütfen aşağıya bakın.
static register_azure_postgre_sql(workspace, datastore_name, server_name, database_name, user_id, user_password, port_number=None, endpoint=None, overwrite=False, enforce_ssl=True, **kwargs)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
server_name
Gerekli
|
PostgreSQL sunucu adı. |
database_name
Gerekli
|
PostgreSQL veritabanı adı. |
user_id
Gerekli
|
PostgreSQL sunucusunun Kullanıcı Kimliği. |
user_password
Gerekli
|
PostgreSQL sunucusunun Kullanıcı Parolası. |
port_number
|
PostgreSQL sunucusunun Bağlantı Noktası Numarası Default value: None
|
endpoint
|
str, <xref:optional>
PostgreSQL sunucusunun uç noktası. Hiçbiri ise, varsayılan olarak postgres.database.azure.com olur. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
enforce_ssl
|
PostgreSQL sunucusunun SSL gereksinimini gösterir. Varsayılan değer True'dır. Default value: True
|
Döndürülenler
Tür | Description |
---|---|
PostgreSQL veritabanı Veri Deposu'nı döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
psql_datastore_name="postgresqldatastore"
server_name=os.getenv("PSQL_SERVERNAME", "<my_server_name>") # FQDN name of the PostgreSQL server
database_name=os.getenv("PSQL_DATBASENAME", "<my_database_name>") # Name of the PostgreSQL database
user_id=os.getenv("PSQL_USERID", "<my_user_id>") # The database user id
user_password=os.getenv("PSQL_USERPW", "<my_user_password>") # The database user password
psql_datastore = Datastore.register_azure_postgre_sql(
workspace=ws,
datastore_name=psql_datastore_name,
server_name=server_name,
database_name=database_name,
user_id=user_id,
user_password=user_password)
register_azure_sql_database
Yeni bir Azure SQL veritabanı Veri Deposu başlatın.
Kimlik bilgisi tabanlı (GA) ve kimlik tabanlı (Önizleme) veri erişimi desteklenir; Hizmet Sorumlusu veya kullanıcı adı + parola kullanmayı seçebilirsiniz. Veri deposuna hiçbir kimlik bilgisi kaydedilmezse, kullanıcıların AAD belirteci şu işlevlerden birini doğrudan çağırırsa not defterinde veya yerel Python programında kullanılır: FileDataset.mount FileDataset.download FileDataset.to_path TabularDataset.to_pandas_dataframe TabularDataset.to_dask_dataframe TabularDataset.to_spark_dataframe TabularDataset.to_parquet_files TabularDataset.to_csv_files işlem hedefinin kimliği, veri erişimi kimlik doğrulaması için Experiment.submit tarafından gönderilen işlerde kullanılır. Burada daha fazla bilgi edinebilirsiniz.
Azure SQL veritabanını Veri Deposu olarak kaydetme örneği için lütfen aşağıya bakın.
static register_azure_sql_database(workspace, datastore_name, server_name, database_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, endpoint=None, overwrite=False, username=None, password=None, subscription_id=None, resource_group=None, grant_workspace_access=False, **kwargs)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
server_name
Gerekli
|
SQL sunucusu adı. "sample.database.windows.net" gibi tam etki alanı adı için server_name değeri "örnek" ve uç nokta değeri "database.windows.net" olmalıdır. |
database_name
Gerekli
|
SQL veritabanı adı. |
tenant_id
|
Hizmet sorumlusunun Dizin Kimliği/Kiracı Kimliği. Default value: None
|
client_id
|
Hizmet sorumlusunun İstemci Kimliği/Uygulama Kimliği. Default value: None
|
client_secret
|
Hizmet sorumlusunun gizli dizisi. Default value: None
|
resource_url
|
str, <xref:optional>
Sql veritabanı deposunda gerçekleştirilecek işlemleri belirleyen kaynak URL'si ( Yok ise) varsayılan olarak https://database.windows.net/kullanılır. Default value: None
|
authority_url
|
str, <xref:optional>
Kullanıcının kimliğini doğrulamak için kullanılan yetkili URL'si varsayılan olarak kullanılır https://login.microsoftonline.com. Default value: None
|
endpoint
|
str, <xref:optional>
SQL sunucusunun uç noktası. Hiçbiri ise, varsayılan olarak database.windows.net olur. Default value: None
|
overwrite
|
bool, <xref:optional>
Var olan bir veri deposuna yazıp yazmayacağınız. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. Default value: False
|
username
|
Veritabanına erişmek için veritabanı kullanıcısının kullanıcı adı. Default value: None
|
password
|
Veritabanına erişmek için veritabanı kullanıcısının parolası. Default value: None
|
skip_validation
Gerekli
|
bool, <xref:optional>
SQL veritabanına bağlanma doğrulamasının atlanıp atlanmadığı. Varsayılan değer False'tur. |
subscription_id
|
str, <xref:optional>
ADLS deposunun ait olduğu aboneliğin kimliği. Default value: None
|
resource_group
|
str, <xref:optional>
ADLS deposunun ait olduğu kaynak grubu. Default value: None
|
grant_workspace_access
|
bool, <xref:optional>
Varsayılan değer False'tur. Machine Learning Studio'dan sanal ağın arkasındaki verilere erişmek için Bunu True olarak ayarlayın.Bu, Machine Learning Studio'dan veri erişiminin kimlik doğrulaması için çalışma alanı yönetilen kimliğini kullanmasını sağlar ve çalışma alanı yönetilen kimliğini depolamanın Okuyucusu olarak ekler. Kabul etmek için depolama alanının sahibi veya kullanıcı erişim yöneticisi olmanız gerekir. Gerekli izne sahip değilseniz yöneticinizden bunu sizin için yapılandırmasını isteyin. Daha fazla bilgi edinin 'https://docs.microsoft.com/azure/machine-learning/how-to-enable-studio-virtual-network' Default value: False
|
Döndürülenler
Tür | Description |
---|---|
SQL veritabanı Veri Deposu'nı döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
sql_datastore_name="azuresqldatastore"
server_name=os.getenv("SQL_SERVERNAME", "<my_server_name>") # Name of the Azure SQL server
database_name=os.getenv("SQL_DATABASENAME", "<my_database_name>") # Name of the Azure SQL database
username=os.getenv("SQL_USER_NAME", "<my_sql_user_name>") # The username of the database user.
password=os.getenv("SQL_USER_PASSWORD", "<my_sql_user_password>") # The password of the database user.
sql_datastore = Datastore.register_azure_sql_database(
workspace=ws,
datastore_name=sql_datastore_name,
server_name=server_name, # name should not contain fully qualified domain endpoint
database_name=database_name,
username=username,
password=password,
endpoint='database.windows.net')
register_dbfs
Yeni bir Databricks Dosya Sistemi (DBFS) veri deposu başlatın.
DBFS veri deposu yalnızca Giriş olarak DataReference ve Azure Machine Learning işlem hatlarında DatabricksStep çıkışı olarak PipelineData oluşturmak için kullanılabilir. Daha fazla ayrıntıya buradan ulaşabilirsiniz..
static register_dbfs(workspace, datastore_name)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Bu veri deposunun ait olduğu çalışma alanı. |
datastore_name
Gerekli
|
Veri deposu adı. |
Döndürülenler
Tür | Description |
---|---|
DBFS Veri Deposu'nı döndürür. |
Açıklamalar
Çalışma alanı bölgesinden farklı bir bölgeden depolama alanı ekliiyorsanız daha yüksek gecikme süresine ve ek ağ kullanım maliyetlerine neden olabilir.
register_hdfs
Not
Bu deneysel bir yöntemdir ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental.
Yeni bir HDFS veri deposu başlatın.
static register_hdfs(workspace, datastore_name, protocol, namenode_address, hdfs_server_certificate, kerberos_realm, kerberos_kdc_address, kerberos_principal, kerberos_keytab=None, kerberos_password=None, overwrite=False)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
bu veri deposunun ait olduğu çalışma alanı |
datastore_name
Gerekli
|
veri deposu adı |
protocol
Gerekli
|
str veya
<xref:_restclient.models.enum>
HDFS kümesiyle iletişim kurarken kullanılacak protokol. http veya https. Olası değerler şunlardır: 'http', 'https' |
namenode_address
Gerekli
|
HDFS ad düğümünün IP adresi veya DNS ana bilgisayar adı. İsteğe bağlı olarak bir bağlantı noktası içerir. |
hdfs_server_certificate
Gerekli
|
str, <xref:optional>
OTOMATIK olarak imzalanan bir sertifikayla TLS kullanılıyorsa HDFS ad düğümünün TLS imzalama sertifikasının yolu. |
kerberos_realm
Gerekli
|
Kerberos bölgesi. |
kerberos_kdc_address
Gerekli
|
Kerberos KDC'sinin IP adresi veya DNS ana bilgisayar adı. |
kerberos_principal
Gerekli
|
Kimlik doğrulaması ve yetkilendirme için kullanılacak Kerberos sorumlusu. |
kerberos_keytab
Gerekli
|
str, <xref:optional>
Kerberos sorumlusuna karşılık gelen anahtarları içeren anahtar sekmesi dosyasının yolu. Bunu veya parolayı belirtin. |
kerberos_password
Gerekli
|
str, <xref:optional>
Kerberos sorumlusuna karşılık gelen parola. Bunu veya bir tuş sekmesi dosyasının yolunu belirtin. |
overwrite
Gerekli
|
bool, <xref:optional>
varolan bir veri deposu üzerine yazar. Veri deposu yoksa bir tane oluşturur. Varsayılan değer False'tur. |
set_as_default
Varsayılan veri depoyu ayarlayın.
set_as_default()
Parametreler
Name | Description |
---|---|
datastore_name
Gerekli
|
Veri deposunun adı. |
unregister
Veri deposunun kaydını kaldırıyor. temel depolama hizmeti silinmez.
unregister()