Konfigurace výpočetních prostředků pro kanál Delta Live Tables
Tento článek obsahuje pokyny a důležité informace o konfiguraci vlastních nastavení výpočetních prostředků pro kanály Delta Live Tables.
Bezserverové kanály neposkytují možnosti konfigurace výpočetních prostředků. Viz Konfigurace kanálu bezserverových živých tabulek Delta.
Výběr zásad clusteru
Uživatelé musí mít oprávnění k nasazení výpočetních prostředků pro konfiguraci a aktualizaci kanálů Delta Live Tables. Správci pracovního prostoru můžou nakonfigurovat zásady clusteru tak, aby uživatelům poskytovaly přístup k výpočetním prostředkům pro delta živé tabulky. Viz Definice omezení výpočetních prostředků kanálu Delta Live Tables.
Poznámka:
Zásady clusteru jsou volitelné. Obraťte se na správce pracovního prostoru, pokud nemáte výpočetní oprávnění požadovaná pro rozdílové živé tabulky.
Pokud chcete zajistit správné použití výchozích hodnot zásad clusteru, nastavte
apply_policy_default_values
jetrue
v konfiguracích clusteru v konfiguraci kanálu:{ "clusters": [ { "label": "default", "policy_id": "<policy-id>", "apply_policy_default_values": true } ] }
Konfigurace značek clusteru
Značky clusteru můžete použít k monitorování využití pro vaše clustery kanálů. Značky clusteru můžete přidat do uživatelského rozhraní Delta Live Tables při vytváření nebo úpravách kanálu nebo úpravou nastavení JSON pro clustery kanálů.
Výběr typů instancí pro spuštění kanálu
Delta Live Tables ve výchozím nastavení vybere typy instancí pro ovladače kanálu a pracovní uzly. Volitelně můžete nakonfigurovat typy instancí.
Vyberte například typy instancí, abyste zlepšili výkon kanálu nebo vyřešili problémy s pamětí při spuštění kanálu. Typy instancí můžete nakonfigurovat při vytváření nebo úpravách kanálu pomocí rozhraní REST API nebo v uživatelském rozhraní Delta Live Tables.
Konfigurace typů instancí při vytváření nebo úpravě kanálu v uživatelském rozhraní Delta Live Tables:
- Klikněte na tlačítko Nastavení .
- V části Upřesnit nastavení kanálu vyberte v rozevíracích nabídkách Typ pracovního procesu a Typ ovladače typy instancí pro kanál.
Pokročilé konfigurace výpočetních prostředků
Poznámka:
Vzhledem k tomu, že výpočetní prostředky jsou plně spravované pro bezserverové kanály DLT, nejsou výpočetní nastavení při výběru bezserverového kanálu k dispozici.
Každý kanál dynamických tabulek Delta má dva přidružené clustery:
- Cluster
updates
zpracovává aktualizace kanálu. - Cluster
maintenance
spouští úlohy každodenní údržby.
Nastavení výpočetních prostředků zadaná pomocí uživatelského rozhraní konfigurace kanálu pracovního prostoru platí pro clustery aktualizací i údržby. Pokud chcete tato nastavení upravit nezávisle, musíte upravit konfiguraci JSON.
Konfigurace těchto clusterů je určena atributem zadaným clusters
v nastavení kanálu.
Pomocí popisků clusteru můžete přidat výpočetní nastavení, která platí jenom pro konkrétní typ clusteru. Při konfiguraci clusterů kanálů můžete použít tři popisky:
Poznámka:
Nastavení popisku clusteru je možné vynechat, pokud definujete pouze jednu konfiguraci clusteru. Popisek default
se použije u konfigurací clusteru, pokud není k dispozici žádné nastavení popisku. Nastavení popisku clusteru se vyžaduje jenom v případě, že potřebujete přizpůsobit nastavení pro různé typy clusterů.
- Popisek
default
definuje výpočetní nastavení proupdates
clustery imaintenance
clustery. Použití stejného nastavení u obou clusterů zlepšuje spolehlivost spuštění údržby tím, že zajišťuje, aby se na cluster údržby použily požadované konfigurace, jako jsou přihlašovací údaje pro přístup k datům pro umístění úložiště. - Popisek
maintenance
definuje výpočetní nastavení, která platí jenommaintenance
pro cluster. Pomocí popiskumaintenance
můžete také přepsat nastavení nakonfigurovaná popiskemdefault
. - Popisek
updates
definuje nastavení, která platí jenomupdates
pro cluster. Použijte ho ke konfiguraci nastavení, která by se neměla v clusterumaintenance
použít.
Nastavení definovaná pomocí popisků default
se updates
sloučí, aby se vytvořila konečná konfigurace clusteru updates
. Pokud je stejné nastavení definované pomocí obou default
i updates
popisků, přepíše nastavení definované popiskem updates
nastavení definované popiskem default
.
Následující příklad definuje konfigurační parametr Sparku, který se přidá pouze do konfigurace clusteru updates
:
{
"clusters": [
{
"label": "default",
"autoscale": {
"min_workers": 1,
"max_workers": 5,
"mode": "ENHANCED"
}
},
{
"label": "updates",
"spark_conf": {
"key": "value"
}
}
]
}
Delta Live Tables má podobné možnosti pro nastavení clusteru jako jiné výpočetní prostředky v Azure Databricks. Stejně jako u jiných nastavení kanálu můžete upravit konfiguraci JSON pro clustery a určit možnosti, které se v uživatelském rozhraní nenachází. Viz Výpočty.
Poznámka:
Vzhledem k tomu, že modul runtime Delta Live Tables spravuje životní cyklus clusterů kanálů a spouští vlastní verzi databricks Runtime, nemůžete některá nastavení clusteru nastavit ručně v konfiguraci kanálu, jako jsou verze Sparku nebo názvy clusterů. Viz atributy clusteru, které nejsou nastaveny uživatelem.
Konfigurace typů instancí pro clustery aktualizací a údržby
Pokud chcete nakonfigurovat typy instancí v nastavení JSON kanálu, klikněte na tlačítko JSON a zadejte konfigurace typů instancí v konfiguraci clusteru:
Poznámka:
Aby se zabránilo přiřazování nepotřebných prostředků ke maintenance
clusteru, použije updates
tento příklad popisek k nastavení typů instancí pouze updates
pro cluster. Pokud chcete přiřadit typy instancí k oběma updates
i maintenance
clusterům, použijte default
popisek nebo vynecháte nastavení popisku. Popisek default
se použije u konfigurací clusteru kanálu, pokud není zadané žádné nastavení pro popisek. Viz Pokročilé konfigurace výpočetních prostředků.
{
"clusters": [
{
"label": "updates",
"node_type_id": "Standard_D12_v2",
"driver_node_type_id": "Standard_D3_v2",
"..." : "..."
}
]
}
Zpoždění vypnutí výpočetních prostředků
Pokud chcete řídit chování vypnutí clusteru, můžete použít vývojový nebo produkční režim nebo použít pipelines.clusterShutdown.delay
nastavení v konfiguraci kanálu. Následující příklad nastaví hodnotu pipelines.clusterShutdown.delay
na 60 sekund:
{
"configuration": {
"pipelines.clusterShutdown.delay": "60s"
}
}
Pokud je povolený režim production
, výchozí hodnota pro pipelines.clusterShutdown.delay
je 0 seconds
. Pokud je povolený režim development
, výchozí hodnota je 2 hours
.
Poznámka:
Vzhledem k tomu, že cluster Delta Live Tables se automaticky vypne, když se nepoužívá, odkazování na zásady clusteru, které nastaví autotermination_minutes
konfiguraci clusteru, způsobí chybu.
Vytvoření clusteru s jedním uzlem
Pokud jste v nastavení clusteru nastavili num_workers
hodnotu 0, cluster se vytvoří jako cluster s jedním uzlem. Konfigurace automatického škálování clusteru a nastavení min_workers
na 0 a max_workers
0 vytvoří cluster s jedním uzlem.
Pokud nakonfigurujete cluster automatického škálování a nastavíte ho jenom min_workers
na 0, cluster se nevytvořil jako cluster s jedním uzlem. Cluster má až do ukončení vždy alespoň jeden aktivní pracovní proces.
Příklad konfigurace clusteru pro vytvoření clusteru s jedním uzlem v Delta Live Tables:
{
"clusters": [
{
"num_workers": 0
}
]
}