Co je rozšířená pozorovatelnost sítě?

Článek
08/02/2024

Advanced Network Observability je debutová funkce sady Advanced Container Networking Services . Poskytuje vám nástroje pro monitorování a diagnostiku na vyšší úrovni, které poskytují přehled o kontejnerizovaných úlohách. Tyto nástroje vám umožňují snadno určit a řešit problémy se sítí a zajistit tak optimální výkon vašich aplikací.

Pokročilá síťová pozorovatelnost je kompatibilní se všemi linuxovými úlohami bez ohledu na to, jestli je podkladová rovina dat Cilium nebo ne Cilium (obě podporují) zajištění flexibility pro potřeby sítě kontejnerů.

Diagram rozšířené pozorovatelnosti sítě

Poznámka:

Pro scénáře roviny dat Cilium je advanced network observability k dispozici od Kubernetes verze 1.29. Pro scénáře roviny dat mimo Cilium je rozšířená pozorovatelnost sítě podporována ve všech distribucích Linuxu, včetně Azure Linuxu počínaje verzí 2.0.

Funkce rozšířené pozorovatelnosti sítě

Advanced Network Observability nabízí následující možnosti pro monitorování problémů souvisejících se sítí ve vašem clusteru:

Metriky na úrovni uzlů: Pochopení stavu sítě kontejneru na úrovni uzlu je zásadní pro zajištění optimálního výkonu aplikace. Tyto metriky poskytují přehled o objemu provozu, vyřazených paketech, počtu připojení atd. podle uzlu. Metriky jsou uložené ve formátu Prometheus a například je můžete zobrazit v Grafaně.
Metriky DNS (DNS a pod-level): Tyto metriky Prometheus zahrnují informace o zdrojovém a cílovém podu, které umožňují určit problémy související se sítí na podrobné úrovni. Metriky pokrývají objem provozu, zahozené pakety, resetování protokolu TCP, toky paketů L4/L7 atd. Existují také metriky DNS (aktuálně pouze pro roviny dat mimo Cilium), které pokrývají chyby DNS a chybějící odpovědi požadavků DNS.
Protokoly toku Hubble: Protokoly toku poskytují hluboký přehled o síťové aktivitě vašeho clusteru. Veškerá komunikace s pody a z podů se protokoluje, takže můžete v průběhu času zkoumat problémy s připojením. Protokoly toku pomáhají zodpovědět otázky, například: obdržel server požadavek klienta? Jaká je latence odezvy mezi požadavkem klienta a odpovědí serveru?
- Hubble CLI: Rozhraní příkazového řádku (CLI) Hubble může načítat protokoly toků v celém clusteru s přizpůsobitelným filtrováním a formátováním.
- Uživatelské rozhraní Hubble: Uživatelské rozhraní Hubble je uživatelsky přívětivé rozhraní založené na prohlížeči pro zkoumání síťové aktivity clusteru. Vytvoří graf připojení služby na základě protokolů toku a zobrazí protokoly toku pro vybraný obor názvů. Uživatelé zodpovídají za zřizování a správu infrastruktury potřebné ke spuštění uživatelského rozhraní Hubble.

Klíčové výhody pokročilé pozorovatelnosti sítě

CNI-Agnostic: Podporováno ve všech variantách Azure CNI, včetně kubenetu.
Cilium a Non-Cilium: Poskytuje jednotné, bezproblémové prostředí v datových rovinách Cilium i non-Cilium.
Pozorovatelnost sítě založená na eBPF: Využívá eBPF (rozšířený filtr paketů Berkeley) k zajištění výkonu a škálovatelnosti k identifikaci potenciálních kritických bodů a problémů se zahlcením dříve, než ovlivní výkon aplikace. Získejte přehled o klíčových ukazatelích stavu sítě, včetně objemu přenosů, zahozených paketů a informací o připojení.
Hloubkový přehled o síťové aktivitě: Zjistěte, jak mezi sebou vaše aplikace komunikují prostřednictvím podrobných protokolů toku sítě.
Zjednodušené možnosti úložiště a vizualizace metrik: Zvolte mezi:
- Azure Managed Prometheus a Grafana: Azure spravuje infrastrukturu a údržbu a umožňuje uživatelům soustředit se na konfiguraci metrik a vizualizaci metrik.
- Bring Your Own (BYO) Prometheus a Grafana: Uživatelé nasazují a konfigurují své vlastní instance a spravují základní infrastrukturu.

Metriky

Metriky na úrovni uzlů

Následující metriky se agregují na každý uzel. Všechny metriky zahrnují popisky:

cluster
instance (Název uzlu)

Non-Cilium
Řasa

Pro scénáře roviny dat mimo Cilium poskytuje Advanced Network Observability metriky pro operační systémy Linux i Windows. Následující tabulka popisuje vygenerované různé metriky.

Název metriky	Popis	Nadbytečné popisky	Linux	Windows
networkobservability_forward_count	Celkový počet přesměrovaných paketů	`direction`	✅	✅
networkobservability_forward_bytes	Celkový počet přeposlaných bajtů	`direction`	✅	✅
networkobservability_drop_count	Celkový počet zahozených paketů	`direction`, `reason`	✅	✅
networkobservability_drop_bytes	Celkový počet vyřazených bajtů	`direction`, `reason`	✅	✅
networkobservability_tcp_state	Počet aktivních soketů TCP podle stavu PROTOKOLU TCP.	`state`	✅	✅
networkobservability_tcp_connection_remote	Počet aktivních soketů TCP podle vzdálené IP adresy nebo portu	`address` (IP), `port`	✅	❌
networkobservability_tcp_connection_stats	Statistiky připojení TCP. (např. zpožděné sady ACK, TCPKeepAlive, TCPSackFailures)	`statistic`	✅	✅
networkobservability_tcp_flag_counters	Počet paketů TCP podle příznaku.	`flag`	❌	✅
networkobservability_ip_connection_stats	Statistika připojení IP.	`statistic`	✅	❌
networkobservability_udp_connection_stats	Statistiky připojení UDP.	`statistic`	✅	❌
networkobservability_udp_active_sockets	Počet aktivních soketů UDP		✅	❌
networkobservability_interface_stats	Statistika rozhraní.	InterfaceName, `statistic`	✅	✅

Pro scénáře roviny dat Cilium poskytuje Advanced Network Observability metriky pouze pro Linux, Systém Windows se v současné době nepodporuje. Cilium zveřejňuje několik metrik, včetně následujících metrik používaných advanced network observability.

Název metriky	Popis	Nadbytečné popisky	Linux	Windows
cilium_forward_count_total	Celkový počet přesměrovaných paketů	`direction`	✅	❌
cilium_forward_bytes_total	Celkový počet přeposlaných bajtů	`direction`	✅	❌
cilium_drop_count_total	Celkový počet zahozených paketů	`direction`, `reason`	✅	❌
cilium_drop_bytes_total	Celkový počet vyřazených bajtů	`direction`, `reason`	✅	❌

Metriky na úrovni podů (metriky Hubble)

Následující metriky se agregují na pod (informace o uzlu se zachovají). Všechny metriky zahrnují popisky:

cluster
instance (Název uzlu)
source nebo destination

U odchozího provozu bude popisek s oborem názvů nebo názvem zdrojového source podu. U příchozího provozu bude popisek s názvem nebo oborem názvů cílového destination podu.

Název metriky	Popis	Nadbytečné popisky	Linux	Windows
hubble_dns_queries_total	Celkový počet požadavků DNS podle dotazu	`source`nebo `destination`, ( `qtypes` `query`typ dotazu)	✅	❌
hubble_dns_responses_total	Celkový počet odpovědí DNS podle dotazu nebo odpovědi	`source`nebo `destination`, ( `qtypes` `query`typ dotazu), `rcode` (návratový kód), `ips_returned` (počet IP adres)	✅	❌
hubble_drop_total	Celkový počet zahozených paketů	`source`nebo `destination`, , `protocolreason`	✅	❌
hubble_tcp_flags_total	Celkový počet paketů TCP podle příznaku	`source` nebo `destination`, `flag`	✅	❌
hubble_flows_processed_total	Celkový počet zpracovaných síťových toků (provoz L4/L7)	`source`nebo `destination`, , `protocol`, `verdict`, `typesubtype`	✅	❌

Omezení

Metriky na úrovni podů jsou dostupné jenom v Linuxu.
Rovina dat Cilium se podporuje od Kubernetes verze 1.29.
Popisky metrik můžou mít drobné rozdíly mezi cilium a necilium shluky.
Rovina dat Cilium v současné době nepodporuje metriky DNS.

Měřítko

Azure managed Prometheus a Grafana ukládají omezení škálování specifická pro službu. Další informace najdete v tématu Výstřižky metrik Prometheus ve velkém měřítku ve službě Azure Monitor

Další kroky

Další informace o Advanced Container Networking Services pro Azure Kubernetes Service (AKS) najdete v tématu Co je Advanced Container Networking Services pro Azure Kubernetes Service (AKS)?.
Pokud chcete vytvořit cluster AKS s pokročilým sledováním sítě a spravovanými Prometheus a Grafana v Azure, přečtěte si téma Nastavení pokročilé pozorovatelnosti sítě pro Azure Kubernetes Service (AKS) spravované prometheus a Grafana.
Pokud chcete vytvořit cluster AKS s pokročilým sledováním sítě a BYO Prometheus a Grafana, přečtěte si téma Nastavení rozšířené pozorovatelnosti sítě pro Azure Kubernetes Service (AKS) BYO Prometheus a Grafana.

Sdílet prostřednictvím