取得工作區物件的識別碼

本文說明如何在 Azure Databricks 中取得工作區、叢集、目錄、模型、筆記本和作業識別碼及 URL。

工作區執行個體名稱、URL 和 ID

唯一的執行個體名稱 (也稱為個別工作區 URL,會指派至每個 Azure Databricks 部署。 這是用來登入 Azure Databricks 部署並提出 API 要求的完整網域名稱。

Azure Databricks 工作區是 Azure Databricks 平台執行的位置,您可以在其中建立 Spark 叢集和排程工作負載。 工作區具有唯一的數值工作區 ID。

每個工作區的 URL

唯一的個別工作區 URL 格式為 adb-<workspace-id>.<random-number>.azuredatabricks.net。 工作區 ID 會緊接著在 adb- 之後和「點」(.) 之前顯示。 針對個別工作區 URL https://adb-5555555555555555.19.azuredatabricks.net/

  • 執行個體名稱為 adb-5555555555555555.19.azuredatabricks.net
  • 工作區 ID 為 5555555555555555

判斷個別工作區 URL

您可以判斷您工作區的個別工作區 URL:

舊版區域 URL

重要

避免使用舊版區域 URL。 它們可能無法用於新工作區、較不可靠,且效能低於個別工作區 URL。

舊版區域 URL 是由部署 Azure Databricks 工作區加上網域 azuredatabricks.net 的區域所組成,例如 https://westus.azuredatabricks.net/

  • 如果您登入類似 https://westus.azuredatabricks.net/ 的舊版區域 URL,則執行個體名稱為 westus.azuredatabricks.net
  • 只有在您使用舊版區域 URL 登入之後,工作區 ID 才會出現在 URL 中。 它會出現在 o= 之後。 在 URL https://<databricks-instance>/?o=6280049833385130 中,工作區 ID 為 6280049833385130

叢集 URL 和 ID

Azure Databricks 叢集為各種使用案例提供統一的平台,例如執行生產 ETL 管線、串流分析、臨機操作分析和機器學習。 每個叢集都有一個唯一 ID,稱為叢集 ID。 這適用於所有用途和作業叢集。 若要使用 REST API 取得叢集的詳細資料,叢集 ID 是不可或缺的。

若要取得叢集 ID,請按一下側邊欄中的 [叢集] 索引標籤,然後選取叢集名稱。 叢集 ID 是此頁面 URL 中 /clusters/ 元件之後的數字

https://<databricks-instance>/#/setting/clusters/<cluster-id>

在下列螢幕擷取畫面中,叢集 ID 為 0831-211914-clean632

叢集 URL

筆記本 URL 和 ID

筆記本是文件的 Web 架構介面,其中包含可執行的程式碼、視覺效果和描述性文字。 筆記本是一個用來與 Azure Databricks 互動的介面。 每個筆記本都有唯一 ID。 筆記本 URL 具有筆記本 ID,因此筆記本 URL 對筆記本而言是唯一的。 它可以與 Azure Databricks 平台上擁有檢視和編輯筆記本權限的任何人共用。 此外,每個筆記本命令 (儲存格) 都有不同的 URL。

若要尋找筆記本 URL 或 ID,請開啟筆記本。 若要尋找儲存格 URL,請按一下命令的內容。

  • 範例筆記本 URL:

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
    
  • 範例筆記本 ID:1940481404050342

  • 範例命令 (儲存格) URL:

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
    

資料夾 ID

資料夾是用來儲存可在 Azure Databricks 工作區中使用之檔案的目錄。 這些檔案可以是筆記本、程式庫或子資料夾。 每個資料夾和每個個別子資料夾都有相關聯的特定 ID。 權限 API 會將此 ID 稱為 directory_id,並用於設定及更新資料夾的權限。

若要擷取 directory_id,請使用工作區 API:

curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status

這是 API 呼叫回應的範例:

{
  "object_type": "DIRECTORY",
  "path": "/Users/me@example.com/MyFolder",
  "object_id": 123456789012345
}

Model ID

模型是指已註冊 MLflow 的模型,可讓您透過階段轉換和版本控制來管理生產中的 MLflow 模型。 需要已註冊的模型 ID,才能透過權限 API 以程式設計方式變更模型的權限。

若要取得已註冊模型的 ID,您可以使用工作區 API 端點 mlflow/databricks/registered-models/get。 例如,下列程式碼會傳回已註冊的模型物件及其屬性,包括其 ID:

curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get

傳回值的格式如下:

{
  "registered_model_databricks": {
    "name":"model_name",
    "id":"ceb0477eba94418e973f170e626f4471"
  }
}

作業 URL 和 ID

作業是立即或依排程執行筆記本或 JAR 的方式。

若要取得作業 URL,請按一下側邊欄中的工作流程圖示 [工作流程],並按一下作業名稱。 作業 ID 位於 URL 中的文字 #job/ 之後。 需要作業 URL 才能針對失敗作業執行的根本原因進行疑難排解。

例如,在下列螢幕擷取畫面中,作業 URL 為:

https://westus.azuredatabricks.net/?o=6280049833385130#job/1

在此範例中,作業 ID 是 1

作業 URL