Obter identificadores para objetos do workspace
Este artigo explica como obter identificadores e URLs de workspace, cluster, painel, diretório, modelo, notebook e trabalho no Azure Databricks.
Nomes, URLs e IDs das instâncias de workspace
Um nome de instância exclusivo, também conhecido como uma URL por workspace, é atribuído a cada implantação do Azure Databricks. É o nome de domínio totalmente qualificado usado para fazer logon em sua implantação do Azure Databricks e fazer solicitações de API.
Um workspace do Azure Databricks é onde a plataforma Azure Databricks é executada e onde você pode criar clusters do Spark e agendar cargas de trabalho. Um workspace tem uma ID de workspace numérica exclusiva.
URL por workspace
Essa URL exclusiva por workspace tem o formato adb-<workspace-id>.<random-number>.azuredatabricks.net
. A ID do workspace aparece imediatamente após adb-
e antes do "ponto" (.). Para a URL por workspace https://adb-5555555555555555.19.azuredatabricks.net/
:
- O nome da instância é
adb-5555555555555555.19.azuredatabricks.net
. - A ID do workspace é
5555555555555555
.
Determinar a URL por workspace
É possível determinar a URL por workspace para seu workspace:
No navegador, quando você estiver logado:
No portal do Azure, selecionando o recurso e anotando o valor no campo URL:
Usando a API do Azure. Consulte Obter uma URL por workspace usando a API do Azure.
URL regional herdada
Importante
Evite usar URLs regionais herdadas. Talvez elas não funcionem em workspaces novos, sejam menos confiáveis e apresentem menor desempenho do que as URLs por workspace.
A URL regional herdada é composta pela região em que o workspace do Azure Databricks é implantado mais o domínio azuredatabricks.net
, por exemplo, https://westus.azuredatabricks.net/
.
- Se você fizer logon em uma URL regional herdada, como
https://westus.azuredatabricks.net/
, o nome da instância seráwestus.azuredatabricks.net
. - A ID do workspace aparece na URL somente depois de você ter feito logon usando uma URL regional herdada. Ele aparece após o
o=
. Na URLhttps://<databricks-instance>/?o=6280049833385130
, a ID do workspace é6280049833385130
.
URL e ID do cluster
Um cluster do Azure Databricks fornece uma plataforma unificada para vários casos de uso, como a execução de pipelines de ETL de produção, análise de streaming, análise ad hoc e aprendizado de máquina. Cada cluster tem uma ID exclusiva chamada ID do cluster. Isso se aplica a clusters para todas as finalidades e de trabalho. Para obter os detalhes de um cluster usando a API REST, a ID do cluster é essencial.
Para obter a ID do cluster, clique na guia Clusters na barra lateral e selecione um nome de cluster. A ID do cluster é o número após o componente /clusters/
na URL desta página
https://<databricks-instance>/#/setting/clusters/<cluster-id>
Na captura de tela a seguir, a ID do cluster é 0831-211914-clean632
.
URL e ID do painel
Um painel de IA/BI é uma apresentação de visualizações de dados e comentários. Cada painel tem uma ID exclusiva. Você pode usar essa ID para construir links diretos que incluem valores de filtro e parâmetro predefinidos ou acessar o painel usando a API REST.
Exemplo de URL do painel:
https://adb-62800498333851.30.azuredatabricks.net/sql/dashboardsv3/01ef9214fcc7112984a50575bf2b460f
Exemplo de ID do painel:
01ef9214fcc7112984a50575bf2b460f
URL e ID do notebook
Um notebook é uma interface baseada na Web para um documento que contém código executável, visualizações e texto de narração. Os notebooks são uma interface para interagir com o Azure Databricks. Cada notebook possui uma ID exclusiva. A URL do notebook tem a ID do notebook, portanto, a URL do notebook é exclusiva para um notebook. Ele pode ser compartilhado com qualquer pessoa na plataforma Azure Databricks com permissão para exibi-lo e editá-lo. Além disso, cada comando de notebook (célula) tem uma URL diferente.
Para localizar uma URL ou ID de notebook, abra um notebook. Para localizar uma URL de célula, clique no conteúdo do comando.
URL de notebook de exemplo:
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
ID de notebook de exemplo:
1940481404050342
.URL de comando de exemplo (célula):
https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
ID da pasta
Uma pasta é um diretório usado para armazenar arquivos que podem ser usados no workspace do Azure Databricks. Esses arquivos podem ser notebooks, bibliotecas ou subpastas. Há uma ID específica associada a cada pasta e a cada subpasta individual. A API de Permissões se refere a essa ID como directory_id e ela é usada na configuração e na atualização das permissões de uma pasta.
Para recuperar a directory_id , use a API de Workspace:
curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status
Este é um exemplo de resposta de chamada à API:
{
"object_type": "DIRECTORY",
"path": "/Users/me@example.com/MyFolder",
"object_id": 123456789012345
}
ID do modelo
Um modelo refere-se a um modelo registrado do MLflow que permite gerenciar modelos MLflow em produção por meio de transições de fases e controle de versão. A ID do modelo registrado é necessária para alterar as permissões no modelo programaticamente por meio da API de Permissões.
Para obter a ID de um modelo registrado, você pode usar o ponto de extremidade mlflow/databricks/registered-models/get
da API do Espaço de trabalho. Por exemplo, o código a seguir retorna o objeto de modelo registrado com suas propriedades, incluindo sua ID:
curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get
O valor retornado tem o formato:
{
"registered_model_databricks": {
"name":"model_name",
"id":"ceb0477eba94418e973f170e626f4471"
}
}
URL e ID do trabalho
Um trabalho é uma forma de executar um notebook ou JAR imediatamente ou de forma programada.
Para obter a URL de um trabalho, clique em Fluxos de trabalho na barra lateral e clique em um nome de trabalho. A ID do trabalho está após o texto #job/
na URL. A URL do trabalho é necessária para solucionar a causa raiz da falha nas execuções do trabalho.
Na captura de tela a seguir, a URL do trabalho é:
https://westus.azuredatabricks.net/?o=6280049833385130#job/1
Neste exemplo, a ID do trabalho é 1
.