Operações de gerenciamento de conta no Azure Data Lake Storage Gen1 usando Python
Saiba como usar o SDK do Python para Azure Data Lake Storage Gen1 para executar operações básicas de gerenciamento de conta, tais como criar uma conta do Data Lake Storage Gen1, listar as contas do Data Lake Storage Gen1 etc. Para obter instruções sobre como executar operações de sistema de arquivos no Data Lake Storage Gen1 usando Python, consulte Operações do sistema de arquivos do Data Lake Storage Gen1 usando Python.
Pré-requisitos
Python. Você pode baixar o Python aqui. Este artigo usa o Python 3.6.2.
Uma assinatura do Azure. Consulte Obter a avaliação gratuita do Azure.
Um grupo de recursos do Azure. Para obter instruções, veja Criar um grupo de recursos do Azure.
Instalar os módulos
Para trabalhar com o Data Lake Storage Gen1 usando o Python, você precisa instalar três módulos.
- O módulo
azure-mgmt-resource
, que inclui módulos do Azure para o Active Directory etc. - O módulo
azure-mgmt-datalake-store
, que inclui as operações de gerenciamento de conta do Azure Data Lake Storage Gen1. Para obter mais informações sobre esse módulo, consulte Referência do módulo de gerenciamento do Azure Data Lake Storage Gen1. - O módulo
azure-datalake-store
, que inclui as operações do sistema de arquivos do Azure Data Lake Storage Gen1. Para obter mais informações sobre esse módulo, consulte referência do módulo filesystem azure-datalake-store.
Use os comandos a seguir para instalar os módulos.
pip install azure-identity
pip install azure-mgmt-resource
pip install azure-mgmt-datalake-store
pip install azure-datalake-store
Criar um novo aplicativo Python
Use o IDE de sua escolha para criar um novo aplicativo Python, por exemplo, mysample.py.
Adicione o snippet a seguir para importar os módulos necessários:
# Acquire a credential object for the app identity. When running in the cloud, # DefaultAzureCredential uses the app's managed identity (MSI) or user-assigned service principal. # When run locally, DefaultAzureCredential relies on environment variables named # AZURE_CLIENT_ID, AZURE_CLIENT_SECRET, and AZURE_TENANT_ID. from azure.identity import DefaultAzureCredential ## Required for Data Lake Storage Gen1 account management from azure.mgmt.datalake.store import DataLakeStoreAccountManagementClient from azure.mgmt.datalake.store.models import CreateDataLakeStoreAccountParameters ## Required for Data Lake Storage Gen1 filesystem management from azure.datalake.store import core, lib, multithread # Common Azure imports import adal from azure.mgmt.resource.resources import ResourceManagementClient from azure.mgmt.resource.resources.models import ResourceGroup # Use these as needed for your application import logging, getpass, pprint, uuid, time
Salve as alterações a mysample.py.
Autenticação
Nesta seção, falaremos sobre as diferentes maneiras de autenticar com Microsoft Entra ID. As opções disponíveis são:
- Para autenticação do usuário final para seu aplicativo, consulte Autenticação de usuário final com o Data Lake Storage Gen1 usando o Python.
- Para autenticação de serviço a serviço do aplicativo, consulte Autenticação de serviço a serviço com o Data Lake Storage Gen1 usando o Python.
Criar cliente e conta do Data Lake Storage Gen1
O snippet a seguir primeiro cria o cliente da conta do Data Lake Storage Gen1. Ele usa o objeto cliente para criar uma conta do Data Lake Storage Gen1. Finalmente, o snippet de código cria um objeto de cliente do sistema de arquivos.
## Declare variables
subscriptionId = 'FILL-IN-HERE'
adlsAccountName = 'FILL-IN-HERE'
resourceGroup = 'FILL-IN-HERE'
location = 'eastus2'
credential = DefaultAzureCredential()
## Create Data Lake Storage Gen1 account management client object
adlsAcctClient = DataLakeStoreAccountManagementClient(credential, subscription_id=subscriptionId)
## Create a Data Lake Storage Gen1 account
adlsAcctResult = adlsAcctClient.accounts.begin_create(
resourceGroup,
adlsAccountName,
CreateDataLakeStoreAccountParameters(
location=location
)
)
Listar as contas do Data Lake Storage Gen1
## List the existing Data Lake Storage Gen1 accounts
result_list_response = adlsAcctClient.accounts.list()
result_list = list(result_list_response)
for items in result_list:
print(items)
Excluir a conta do Data Lake Storage Gen1
## Delete an existing Data Lake Storage Gen1 account
adlsAcctClient.accounts.begin_delete(resourceGroup, adlsAccountName)