如何在 Microsoft Fabric 中建立自訂 Spark 集區

本文件說明如何在 Microsoft Fabric 中為分析工作負載建立自訂 Apache Spark 集區。 Apache Spark 集區可讓用戶根據其特定需求建立量身打造的計算環境,以確保最佳的效能和資源使用率。

您可以指定自動調整的節點數目上線。 根據這些值,系統會在作業的計算需求變更時動態取得和淘汰節點,進而高效地調整和改善效能。 Spark 集區中執行程式的動態配置也減少了對手動執行程式設定的需求。 相反,系統會根據資料量和工作層級計算需求來調整執行程式的數目。 此程序可讓您專注於工作負載,而不必擔心效能優化和資源管理。

注意

若要建立自訂 Spark 集區,您需要工作區的管理員存取權限。 容量管理員必須在 [容量管理員設定] [Spark 計算] 區段中啟用 [自訂工作區集區] 選項。 若要深入了解,請參閱<針對 Fabric 容量的 Spark 計算設定>。

建立自訂 Spark 集區

若要建立或管理與您的工作區相關聯的 Spark 集區:

  1. 前往工作區並選取 [工作區設定]

    螢幕擷取畫面,其中顯示在 [工作區設定] 功能表中選取 [資料工程] 的位置。

  2. 選取 [資料工程/科學] 選項以展開功能表,然後選取 [Spark 計算]

    Spark 設定詳細資料檢視的螢幕擷取畫面。

  3. 選取 [+ 新增集區] 選項。 在 [建立集區] 螢幕中,對 Spark 集區進行命名。 此外,選擇 [節點系列],並根據工作負載的計算需求從可用的大小 (大、超大特大) 中選取 [節點大小]。

    螢幕擷取畫面,其中顯示了自訂集區建立選項。

  4. 可以將自訂集區的最小節點組態設為 1。 由於 Fabric Spark 為具有單一節點的叢集提供可還原的可用性,因此您不必擔心作業失敗、在失敗期間遺失工作階段,或為較小的 Spark 作業支付過多的計算費用。

  5. 您可以啟用或停用自訂 Spark 集區的自動調整。 啟用自動調整後,集區會以動態方式取得新的節點,最多可達到使用者指定的節點數目上限,然後在作業執行后淘汰它們。 此功能可根據作業需求調整資源,從而確保更好的效能。 您可以調整節點的大小,使其符合在 Fabric 容量 SKU 中購買的容量單位。

    螢幕擷取畫面,其中顯示了自動縮放和動態配置之自訂集區建立選項。

  6. 您也可以選擇為 Spark 集區啟用動態執行程式配置,這會自動決定使用者指定上限內的最佳執行程式數目。 此功能會根據資料量調整執行程式數目,進而改善效能和資源使用率。

這些自訂集區的預設自動暫停持續時間為 2 分鐘。 達到自動暫停持續時間之後,工作階段就會過期,並且叢集會被取消配置。 系統會根據節點數目和自訂 Spark 集區的使用時長來向您收取費用。