Co je rozšířená pozorovatelnost sítě?
Advanced Network Observability je debutová funkce sady Advanced Container Networking Services . Poskytuje vám nástroje pro monitorování a diagnostiku na vyšší úrovni, které poskytují přehled o kontejnerizovaných úlohách. Tyto nástroje vám umožňují snadno určit a řešit problémy se sítí a zajistit tak optimální výkon vašich aplikací.
Pokročilá síťová pozorovatelnost je kompatibilní se všemi linuxovými úlohami bez ohledu na to, jestli je podkladová rovina dat Cilium nebo ne Cilium (obě podporují) zajištění flexibility pro potřeby sítě kontejnerů.
Poznámka:
Pro scénáře roviny dat Cilium je advanced network observability k dispozici od Kubernetes verze 1.29. Pro scénáře roviny dat mimo Cilium je rozšířená pozorovatelnost sítě podporována ve všech distribucích Linuxu, včetně Azure Linuxu počínaje verzí 2.0.
Funkce rozšířené pozorovatelnosti sítě
Advanced Network Observability nabízí následující možnosti pro monitorování problémů souvisejících se sítí ve vašem clusteru:
Metriky na úrovni uzlů: Pochopení stavu sítě kontejneru na úrovni uzlu je zásadní pro zajištění optimálního výkonu aplikace. Tyto metriky poskytují přehled o objemu provozu, vyřazených paketech, počtu připojení atd. podle uzlu. Metriky jsou uložené ve formátu Prometheus a například je můžete zobrazit v Grafaně.
Metriky DNS (DNS a pod-level): Tyto metriky Prometheus zahrnují informace o zdrojovém a cílovém podu, které umožňují určit problémy související se sítí na podrobné úrovni. Metriky pokrývají objem provozu, zahozené pakety, resetování protokolu TCP, toky paketů L4/L7 atd. Existují také metriky DNS (aktuálně pouze pro roviny dat mimo Cilium), které pokrývají chyby DNS a chybějící odpovědi požadavků DNS.
Protokoly toku Hubble: Protokoly toku poskytují hluboký přehled o síťové aktivitě vašeho clusteru. Veškerá komunikace s pody a z podů se protokoluje, takže můžete v průběhu času zkoumat problémy s připojením. Protokoly toku pomáhají zodpovědět otázky, například: obdržel server požadavek klienta? Jaká je latence odezvy mezi požadavkem klienta a odpovědí serveru?
Hubble CLI: Rozhraní příkazového řádku (CLI) Hubble může načítat protokoly toků v celém clusteru s přizpůsobitelným filtrováním a formátováním.
Uživatelské rozhraní Hubble: Uživatelské rozhraní Hubble je uživatelsky přívětivé rozhraní založené na prohlížeči pro zkoumání síťové aktivity clusteru. Vytvoří graf připojení služby na základě protokolů toku a zobrazí protokoly toku pro vybraný obor názvů. Uživatelé zodpovídají za zřizování a správu infrastruktury potřebné ke spuštění uživatelského rozhraní Hubble.
Klíčové výhody pokročilé pozorovatelnosti sítě
CNI-Agnostic: Podporováno ve všech variantách Azure CNI, včetně kubenetu.
Cilium a Non-Cilium: Poskytuje jednotné, bezproblémové prostředí v datových rovinách Cilium i non-Cilium.
Pozorovatelnost sítě založená na eBPF: Využívá eBPF (rozšířený filtr paketů Berkeley) k zajištění výkonu a škálovatelnosti k identifikaci potenciálních kritických bodů a problémů se zahlcením dříve, než ovlivní výkon aplikace. Získejte přehled o klíčových ukazatelích stavu sítě, včetně objemu přenosů, zahozených paketů a informací o připojení.
Hloubkový přehled o síťové aktivitě: Zjistěte, jak mezi sebou vaše aplikace komunikují prostřednictvím podrobných protokolů toku sítě.
Zjednodušené možnosti úložiště a vizualizace metrik: Zvolte mezi:
- Azure Managed Prometheus a Grafana: Azure spravuje infrastrukturu a údržbu a umožňuje uživatelům soustředit se na konfiguraci metrik a vizualizaci metrik.
- Bring Your Own (BYO) Prometheus a Grafana: Uživatelé nasazují a konfigurují své vlastní instance a spravují základní infrastrukturu.
Metriky
Metriky na úrovni uzlů
Následující metriky se agregují na každý uzel. Všechny metriky zahrnují popisky:
cluster
instance
(Název uzlu)
Pro scénáře roviny dat mimo Cilium poskytuje Advanced Network Observability metriky pro operační systémy Linux i Windows. Následující tabulka popisuje vygenerované různé metriky.
Název metriky | Popis | Nadbytečné popisky | Linux | Windows |
---|---|---|---|---|
networkobservability_forward_count | Celkový počet přesměrovaných paketů | direction |
✅ | ✅ |
networkobservability_forward_bytes | Celkový počet přeposlaných bajtů | direction |
✅ | ✅ |
networkobservability_drop_count | Celkový počet zahozených paketů | direction , reason |
✅ | ✅ |
networkobservability_drop_bytes | Celkový počet vyřazených bajtů | direction , reason |
✅ | ✅ |
networkobservability_tcp_state | Počet aktivních soketů TCP podle stavu PROTOKOLU TCP. | state |
✅ | ✅ |
networkobservability_tcp_connection_remote | Počet aktivních soketů TCP podle vzdálené IP adresy nebo portu | address (IP), port |
✅ | ❌ |
networkobservability_tcp_connection_stats | Statistiky připojení TCP. (např. zpožděné sady ACK, TCPKeepAlive, TCPSackFailures) | statistic |
✅ | ✅ |
networkobservability_tcp_flag_counters | Počet paketů TCP podle příznaku. | flag |
❌ | ✅ |
networkobservability_ip_connection_stats | Statistika připojení IP. | statistic |
✅ | ❌ |
networkobservability_udp_connection_stats | Statistiky připojení UDP. | statistic |
✅ | ❌ |
networkobservability_udp_active_sockets | Počet aktivních soketů UDP | ✅ | ❌ | |
networkobservability_interface_stats | Statistika rozhraní. | InterfaceName, statistic |
✅ | ✅ |
Metriky na úrovni podů (metriky Hubble)
Následující metriky se agregují na pod (informace o uzlu se zachovají). Všechny metriky zahrnují popisky:
cluster
instance
(Název uzlu)source
nebodestination
U odchozího provozu bude popisek s oborem názvů nebo názvem zdrojového source
podu.
U příchozího provozu bude popisek s názvem nebo oborem názvů cílového destination
podu.
Název metriky | Popis | Nadbytečné popisky | Linux | Windows |
---|---|---|---|---|
hubble_dns_queries_total | Celkový počet požadavků DNS podle dotazu | source nebo destination , ( qtypes query typ dotazu) |
✅ | ❌ |
hubble_dns_responses_total | Celkový počet odpovědí DNS podle dotazu nebo odpovědi | source nebo destination , ( qtypes query typ dotazu), rcode (návratový kód), ips_returned (počet IP adres) |
✅ | ❌ |
hubble_drop_total | Celkový počet zahozených paketů | source nebo destination , , protocol reason |
✅ | ❌ |
hubble_tcp_flags_total | Celkový počet paketů TCP podle příznaku | source nebo destination , flag |
✅ | ❌ |
hubble_flows_processed_total | Celkový počet zpracovaných síťových toků (provoz L4/L7) | source nebo destination , , protocol , verdict , type subtype |
✅ | ❌ |
Omezení
- Metriky na úrovni podů jsou dostupné jenom v Linuxu.
- Rovina dat Cilium se podporuje od Kubernetes verze 1.29.
- Popisky metrik můžou mít drobné rozdíly mezi cilium a necilium shluky.
- Rovina dat Cilium v současné době nepodporuje metriky DNS.
Měřítko
Azure managed Prometheus a Grafana ukládají omezení škálování specifická pro službu. Další informace najdete v tématu Výstřižky metrik Prometheus ve velkém měřítku ve službě Azure Monitor
Další kroky
Další informace o Advanced Container Networking Services pro Azure Kubernetes Service (AKS) najdete v tématu Co je Advanced Container Networking Services pro Azure Kubernetes Service (AKS)?.
Pokud chcete vytvořit cluster AKS s pokročilým sledováním sítě a spravovanými Prometheus a Grafana v Azure, přečtěte si téma Nastavení pokročilé pozorovatelnosti sítě pro Azure Kubernetes Service (AKS) spravované prometheus a Grafana.
Pokud chcete vytvořit cluster AKS s pokročilým sledováním sítě a BYO Prometheus a Grafana, přečtěte si téma Nastavení rozšířené pozorovatelnosti sítě pro Azure Kubernetes Service (AKS) BYO Prometheus a Grafana.
Azure Kubernetes Service