Microsoft Fabric Apache Spark 工作區管理設定

發行項
10/15/2024

適用於：Microsoft Fabric 中的 ✅ 資料工程和資料科學

在 Microsoft Fabric 中建立工作區時，會自動建立與該工作區相關聯的入門集區。透過 Microsoft Fabric 中的簡易設定，不需要選擇節點或機器大小，因為這些選項會在幕後為您處理。此設定提供更快速 (5-10 秒) 的 Apache Spark 工作階段啟動體驗，讓使用者在許多常見案例中開始使用和執行 Apache Spark 工作，而不必擔心設定計算。針對具有特定計算需求的進階案例，使用者可以建立自訂 Apache Spark 集區，並根據節點的效能需求來調整節點大小。

若要變更工作區中的 Apache Spark 設定，需擁有該工作區的管理員角色。若要深入了解，請參閱＜工作區中的角色＞。

若要管理與工作區相關聯的集區 Spark 設定：

前往工作區中的 [工作區設定]，然後選擇 [資料工程/科學] 選項以展開功能表：
您會在左邊功能表中看到 [Spark 計算] 選項：

注意

如果將預設集區從 [入門集區] 變更為 [自訂 Spark 集區]，則可能需要較長的工作階段啟動時間 (~3 分鐘)。

集區

工作區的預設集區

您可以為工作區使用自動建立的入門集區，或建立自訂集區。

入門集區：預先凍結的即時集區會自動建立，帶來更快速的體驗。這些叢集為中型大小。入門集區會根據購買的 Fabric 容量 SKU 設定為預設組態。管理員可以根據其 Spark 工作負載規模需求來自訂最大節點和執行程式。若要深入了解，請參閱＜設定入門集區＞。
自訂 Spark 集區：您可以根據您的 Spark 工作需求調整節點大小、自動縮放，以及動態配置執行程式。若要建立自訂 Spark 集區，容量管理員應該在 [容量管理員]設定的 [Spark 計算] 區段中啟用 [自訂工作區集區] 選項。

注意

預設啟用自訂工作區集區的容量層級控制。若要深入了解，請參閱＜設定和管理 Fabric 容量的資料工程和資料科學設定。

管理員可以選取 [新增集區] 選項，根據計算需求建立自訂 Spark 集區。

Microsoft Fabric Apache Spark 支援單一節點叢集，可讓使用者選取最小節點組態為 1，在此情況下，驅動程式和執行程式會在單一節點中執行。這些單一節點叢集可在節點失敗的情況下提供可還原的高可用性，並且為具有較小計算需求的工作負載提供更好的工作可靠性。您也可以為自訂 Spark 集區啟用或停用自動縮放選項。啟用自動縮放時，集區會在使用者指定的最大節點限制內取得新的節點，並在工作執行之後淘汰這些節點，以提升效能。

您也可以選取選項，以動態方式配置執行程式，以根據資料磁碟區在指定的最大界限內自動將最佳數目的執行程式設為集區，以獲得更佳的效能。