持續執行作業

使用連續模式來排程工作負載以持續執行。 Databricks 建議針對一律開啟串流工作負載使用連續模式。

連續模式會取代結構化串流工作負載的舊版建議,以無限制的重試原則和最多一次並行執行來設定作業。

重要

作業的無伺服器計算不支援連續模式。

設定作業以連續模式執行

若要設定作業以連續模式執行,請執行下列動作:

  1. 在側邊欄中,按下 [工作流程]
  2. 在 [名稱] 資料行,按下 [作業] 索引標籤。
  3. 按下 [作業詳細資料] 面板中的 [新增觸發程序],在 [觸發程序類型] 中選取 [連續],然後按下 [儲存]

若要停止連續作業,請按下 [暫停] 按鈕。 按下 [繼續] 以連續模式重新啟動作業。

注意

  • 連續作業只能有一個執行中的執行個體。
  • 執行完成和新的執行開始之間存在延遲。 此延遲應小於 60 秒。
  • 您無法使用工作相依性搭配連續作業。
  • 您無法將使用 [重試原則} 搭配連續作業。 相反地,連續作業會使用 [指數輪詢] 來管理作業執行失敗。
  • 選取 [立即 執行] 以在暫停的持續作業上觸發新作業執行。
  • 若要讓連續作業挑選新的設定,請取消現有的執行。 新的執行會自動啟動。 您也可以按下 [重新啟動執行] 以使用更新的組態重新啟動作業執行。

如何處理連續作業的失敗?

Azure Databricks 使用 [指數輪詢] 配置來管理連續失敗的連續作業。 指數輪詢可讓連續作業在沒有暫停的情況下執行,並在發生可復原失敗時回到狀況良好的狀態。

當連續作業超過連續失敗的允許閾值時,下列描述後續作業的執行管理方式:

  1. 工作會在系統設定的重試期間之後重新啟動。
  2. 如果下一個作業執行失敗,重試期間就會增加,而且作業會在這個新的重試期間之後重新啟動。
    1. 針對每個後續的作業執行失敗,重試期間會增加至系統所設定的重試期間上限。 達到重試期間上限之後,工作會使用重試期間上限繼續重試。 連續作業的重試次數沒有限制。
    2. 如果作業執行順利完成並啟動新的執行,或如果執行超過閾值而沒有失敗,則作業會視為狀況良好,而輪詢順序會重設。

您可以在 [作業 UI] 中以指數輪詢狀態重新啟動連續作業,或將作業 ID 傳遞至 Jobs 2.1 API 中的 POST /api/2.1/jobs/run-now 要求或 Jobs 2.0 API 中的 POST /api/2.0/jobs/run-now 要求。