Co je rozšířená pozorovatelnost sítě?

Advanced Network Observability je debutová funkce sady Advanced Container Networking Services . Poskytuje vám nástroje pro monitorování a diagnostiku na vyšší úrovni, které poskytují přehled o kontejnerizovaných úlohách. Tyto nástroje vám umožňují snadno určit a řešit problémy se sítí a zajistit tak optimální výkon vašich aplikací.

Pokročilá síťová pozorovatelnost je kompatibilní se všemi linuxovými úlohami bez ohledu na to, jestli je podkladová rovina dat Cilium nebo ne Cilium (obě podporují) zajištění flexibility pro potřeby sítě kontejnerů.

Diagram rozšířené pozorovatelnosti sítě

Poznámka:

Pro scénáře roviny dat Cilium je advanced network observability k dispozici od Kubernetes verze 1.29. Pro scénáře roviny dat mimo Cilium je rozšířená pozorovatelnost sítě podporována ve všech distribucích Linuxu, včetně Azure Linuxu počínaje verzí 2.0.

Funkce rozšířené pozorovatelnosti sítě

Advanced Network Observability nabízí následující možnosti pro monitorování problémů souvisejících se sítí ve vašem clusteru:

  • Metriky na úrovni uzlů: Pochopení stavu sítě kontejneru na úrovni uzlu je zásadní pro zajištění optimálního výkonu aplikace. Tyto metriky poskytují přehled o objemu provozu, vyřazených paketech, počtu připojení atd. podle uzlu. Metriky jsou uložené ve formátu Prometheus a například je můžete zobrazit v Grafaně.

  • Metriky DNS (DNS a pod-level): Tyto metriky Prometheus zahrnují informace o zdrojovém a cílovém podu, které umožňují určit problémy související se sítí na podrobné úrovni. Metriky pokrývají objem provozu, zahozené pakety, resetování protokolu TCP, toky paketů L4/L7 atd. Existují také metriky DNS (aktuálně pouze pro roviny dat mimo Cilium), které pokrývají chyby DNS a chybějící odpovědi požadavků DNS.

  • Protokoly toku Hubble: Protokoly toku poskytují hluboký přehled o síťové aktivitě vašeho clusteru. Veškerá komunikace s pody a z podů se protokoluje, takže můžete v průběhu času zkoumat problémy s připojením. Protokoly toku pomáhají zodpovědět otázky, například: obdržel server požadavek klienta? Jaká je latence odezvy mezi požadavkem klienta a odpovědí serveru?

    • Hubble CLI: Rozhraní příkazového řádku (CLI) Hubble může načítat protokoly toků v celém clusteru s přizpůsobitelným filtrováním a formátováním.

    • Uživatelské rozhraní Hubble: Uživatelské rozhraní Hubble je uživatelsky přívětivé rozhraní založené na prohlížeči pro zkoumání síťové aktivity clusteru. Vytvoří graf připojení služby na základě protokolů toku a zobrazí protokoly toku pro vybraný obor názvů. Uživatelé zodpovídají za zřizování a správu infrastruktury potřebné ke spuštění uživatelského rozhraní Hubble.

Klíčové výhody pokročilé pozorovatelnosti sítě

  • CNI-Agnostic: Podporováno ve všech variantách Azure CNI, včetně kubenetu.

  • Cilium a Non-Cilium: Poskytuje jednotné, bezproblémové prostředí v datových rovinách Cilium i non-Cilium.

  • Pozorovatelnost sítě založená na eBPF: Využívá eBPF (rozšířený filtr paketů Berkeley) k zajištění výkonu a škálovatelnosti k identifikaci potenciálních kritických bodů a problémů se zahlcením dříve, než ovlivní výkon aplikace. Získejte přehled o klíčových ukazatelích stavu sítě, včetně objemu přenosů, zahozených paketů a informací o připojení.

  • Hloubkový přehled o síťové aktivitě: Zjistěte, jak mezi sebou vaše aplikace komunikují prostřednictvím podrobných protokolů toku sítě.

  • Zjednodušené možnosti úložiště a vizualizace metrik: Zvolte mezi:

    • Azure Managed Prometheus a Grafana: Azure spravuje infrastrukturu a údržbu a umožňuje uživatelům soustředit se na konfiguraci metrik a vizualizaci metrik.
    • Bring Your Own (BYO) Prometheus a Grafana: Uživatelé nasazují a konfigurují své vlastní instance a spravují základní infrastrukturu.

Metriky

Metriky na úrovni uzlů

Následující metriky se agregují na každý uzel. Všechny metriky zahrnují popisky:

  • cluster
  • instance (Název uzlu)

Pro scénáře roviny dat mimo Cilium poskytuje Advanced Network Observability metriky pro operační systémy Linux i Windows. Následující tabulka popisuje vygenerované různé metriky.

Název metriky Popis Nadbytečné popisky Linux Windows
networkobservability_forward_count Celkový počet přesměrovaných paketů direction
networkobservability_forward_bytes Celkový počet přeposlaných bajtů direction
networkobservability_drop_count Celkový počet zahozených paketů direction, reason
networkobservability_drop_bytes Celkový počet vyřazených bajtů direction, reason
networkobservability_tcp_state Počet aktivních soketů TCP podle stavu PROTOKOLU TCP. state
networkobservability_tcp_connection_remote Počet aktivních soketů TCP podle vzdálené IP adresy nebo portu address (IP), port
networkobservability_tcp_connection_stats Statistiky připojení TCP. (např. zpožděné sady ACK, TCPKeepAlive, TCPSackFailures) statistic
networkobservability_tcp_flag_counters Počet paketů TCP podle příznaku. flag
networkobservability_ip_connection_stats Statistika připojení IP. statistic
networkobservability_udp_connection_stats Statistiky připojení UDP. statistic
networkobservability_udp_active_sockets Počet aktivních soketů UDP
networkobservability_interface_stats Statistika rozhraní. InterfaceName, statistic

Metriky na úrovni podů (metriky Hubble)

Následující metriky se agregují na pod (informace o uzlu se zachovají). Všechny metriky zahrnují popisky:

  • cluster
  • instance (Název uzlu)
  • source nebo destination

U odchozího provozu bude popisek s oborem názvů nebo názvem zdrojového source podu. U příchozího provozu bude popisek s názvem nebo oborem názvů cílového destination podu.

Název metriky Popis Nadbytečné popisky Linux Windows
hubble_dns_queries_total Celkový počet požadavků DNS podle dotazu sourcenebo destination, ( qtypes querytyp dotazu)
hubble_dns_responses_total Celkový počet odpovědí DNS podle dotazu nebo odpovědi sourcenebo destination, ( qtypes querytyp dotazu), rcode (návratový kód), ips_returned (počet IP adres)
hubble_drop_total Celkový počet zahozených paketů sourcenebo destination, , protocolreason
hubble_tcp_flags_total Celkový počet paketů TCP podle příznaku source nebo destination, flag
hubble_flows_processed_total Celkový počet zpracovaných síťových toků (provoz L4/L7) sourcenebo destination, , protocol, verdict, typesubtype

Omezení

  • Metriky na úrovni podů jsou dostupné jenom v Linuxu.
  • Rovina dat Cilium se podporuje od Kubernetes verze 1.29.
  • Popisky metrik můžou mít drobné rozdíly mezi cilium a necilium shluky.
  • Rovina dat Cilium v současné době nepodporuje metriky DNS.

Měřítko

Azure managed Prometheus a Grafana ukládají omezení škálování specifická pro službu. Další informace najdete v tématu Výstřižky metrik Prometheus ve velkém měřítku ve službě Azure Monitor

Další kroky