將數據從 Delta Live Tables 發佈至 Hive 中繼存放區

您可以將數據集發佈至 Hive中繼存放區,讓管線的輸出數據可供探索並可供查詢。 若要將數據集發佈至中繼存放區,請在建立管線時,於 [目標 ] 欄位中輸入架構名稱。 您也可以將目標資料庫新增至現有的管線。

根據預設,在 Delta Live Tables 中建立的所有數據表和檢視都是管線的本機。 您必須將數據表發佈至目標架構,才能在宣告數據表的管線外部查詢或使用 Delta Live Tables 數據集。

若要將管線的資料表發佈至 Unity 目錄,請參閱搭配差異即時資料表管線使用 Unity 目錄

如何將 Delta Live Tables 數據集發佈至架構

您可以使用管線設定和建立管線 UI 中的 [目標架構] 字段,為 Delta Live Tables 管線中的所有數據表宣告目標架構

您也可以藉由設定 target 值,在 JSON 組態中指定架構。

您必須執行管線的更新,才能將結果發佈至目標架構。

您可以使用這項功能搭配多個環境組態,根據環境發佈至不同的架構。 例如,您可以發佈至 dev 用於開發的架構,以及 prod 生產數據的架構。

如何在 Delta Live Tables 中查詢數據集

更新完成後,您可以檢視架構和數據表、查詢數據,或使用下游應用程式中的數據。

發行之後,您可以從任何具有目標架構存取權的環境查詢 Delta Live Tables 數據表。 這包括 Databricks SQL、筆記本和其他 Delta 實時數據表管線。

重要

當您建立組 target 態時,只會發佈數據表和相關聯的元數據。 檢視不會發佈至中繼存放區。

從目標架構排除數據表

如果您需要計算不適合外部耗用量的中繼數據表,您可以使用 關鍵詞防止它們發佈至架構 TEMPORARY 。 臨時表仍會根據 Delta Live Tables 語意來儲存及處理數據,但不應在目前管線之外存取。 臨時表會保存建立管線的存留期。 使用下列語法來宣告臨時表:

SQL

CREATE TEMPORARY MATERIALIZED VIEW temp_table
AS SELECT ... ;

Python

@dlt.table(
  temporary=True)
def temp_table():
  return ("...")