Monitorování několika clusterů Azure Stack HCI pomocí přehledů

Platí pro: Azure Stack HCI, verze 22H2

Tento článek vysvětluje, jak pomocí Přehledů monitorovat více clusterů Azure Stack HCI. Informace o jednom clusteru Azure Stack HCI najdete v tématu Monitorování Služby Azure Stack HCI pomocí přehledů.

Důležité

Pokud jste zaregistrovali cluster Azure Stack HCI a nakonfigurovali přehledy před listopadem 2023, některé funkce, které používají agenta Azure Monitoru (AMA), jako jsou Arc pro servery, VM Insights, Defender for Cloud nebo Sentinel, nemusí správně shromažďovat protokoly a data událostí. Pokyny k řešení potíží najdete v části Řešení potíží s clustery zaregistrovanými před listopadem 2023 .

Informace o výhodách, požadavcích a postupu povolení přehledů v jednotlivých clusterech najdete v tématechVýhody, Požadavky a Povolení přehledů.

Podívejte se na video s rychlým úvodem:

Zobrazení přehledů o stavu, výkonu a využití

Insights ukládá svá data v pracovním prostoru služby Log Analytics, který umožňuje poskytovat výkonné agregace a filtrování a analyzovat trendy dat v průběhu času. Za Přehledy nejsou žádné přímé náklady. Uživatelům se účtují poplatky na základě objemu ingestovaných dat a nastavení uchovávání dat v pracovním prostoru služby Log Analytics.

K přehledům můžete přistupovat z centra > Přehledy služby Azure Monitor > Azure Stack HCI. Zobrazí se následující karty pro přepínání mezi zobrazeními: Přidat do monitorování, Stav clusteru, Servery, Virtuální počítače, Úložiště.

Filtrování výsledků

Vizualizaci je možné filtrovat napříč předplatnými. Výsledky můžete filtrovat na základě následujících rozevíracích nabídek:

  • Časový rozsah: Tento filtr umožňuje vybrat oblast pro zobrazení trendu. Výchozí hodnota je Posledních 24 hodin.
  • Odběry: Zobrazuje předplatná, která mají zaregistrované clustery Azure Stack HCI. V tomto filtru můžete vybrat více předplatných.
  • Clustery HCI: Seznamy zaregistrované clustery Azure Stack HCI, které mají ve vybraném časovém rozsahu povolené funkce protokolování a monitorování. Z tohoto filtru můžete vybrat více clusterů.
  • Skupiny prostředků: Tento filtr umožňuje vybrat všechny clustery v rámci skupiny prostředků.

Přidat do monitorování

Tato funkce poskytuje podrobnosti o clusterech, které uživatel nemonitoruje. Pokud chcete spustit monitorování clusteru, vyberte ho, aby se cluster otevřel, a pak vyberte Přehledy schopností>. Pokud cluster nevidíte, ujistěte se, že se nedávno připojil k Azure.

Snímek obrazovky pro výběr clusteru pro monitorování

Sloupec Popis Příklad
Cluster Název clusteru. 27cls1
Stav připojení k Azure Stav prostředku HCI. Připojeno
Verze operačního systému Operační systém se sestavuje na serveru. 10.0.20348.10131

Ve výchozím nastavení se v zobrazení mřížky zobrazuje prvních 250 řádků. Hodnotu můžete nastavit úpravou řádků mřížky, jak je znázorněno na následujícím obrázku:

Snímek obrazovky s obrazovkou pro nastavení hodnot mřížky

Podrobnosti můžete exportovat v Excelu tak, že vyberete Exportovat do Excelu , jak je znázorněno na následujícím obrázku:

Snímek obrazovky s odkazem pro export do Excelu

Excel zobrazí stav připojení Azure následujícím způsobem:

  • 0: Nezaregistrováno
  • 1: Odpojeno
  • 2: Není nedávno
  • 3: Připojeno

Stav clusteru

Toto zobrazení poskytuje přehled stavu clusterů.

Snímek obrazovky s informacemi o přehledu stavu clusteru

Sloupec Popis Příklad
Cluster Název clusteru. 27cls1
Naposledy aktualizované Časové razítko poslední aktualizace serveru. 9.4.2022, 12:15:42
Stav Poskytuje stav prostředků serveru v clusteru. Může být v pořádku, varovná, kritická nebo jiná. V pořádku
Chybující prostředek Popis prostředku, který chybu způsobil. Server, fond úložiště, subsystém
Celkový počet serverů Počet serverů v clusteru. 4

Pokud váš cluster chybí nebo se zobrazuje stav Jiné, přejděte do pracovního prostoru služby Log Analytics , který se používá pro cluster, a ujistěte se, že konfigurace agenta zachytává data z protokolu microsoft-windows-health/operational . Také se ujistěte, že se clustery nedávno připojily k Azure, a zkontrolujte, že clustery nejsou v tomto sešitu vyfiltrované.

Server

Toto zobrazení poskytuje přehled stavu a výkonu serveru a využití vybraných clusterů. Toto zobrazení je vytvořené pomocí události serveru s ID 3000 kanálu protokolu událostí Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek můžete dále rozbalit, abyste viděli stav uzlu. V interakci s prostředkem clusteru a serveru můžete přejít na stránku příslušného prostředku.

Snímek obrazovky zobrazující stav serverů

Virtuální počítače

Toto zobrazení poskytuje stav všech virtuálních počítačů ve vybraném clusteru. Zobrazení je vytvořené pomocí události virtuálního počítače s ID 3003 kanálu protokolu událostí Microsoft-Windows-SDDC-Management/Operational Windows. Každý řádek je možné dále rozbalit a zobrazit distribuci virtuálních počítačů mezi servery v clusteru. Pomocí interakce s prostředkem clusteru a uzlu můžete přejít na stránku příslušného prostředku.

Snímek obrazovky znázorňující stav virtuálních počítačů

Metric Popis Příklad
Server clusteru > Název clusteru. Při rozšíření se zobrazí servery v rámci clusteru. Sample-VM-1
Poslední aktualizace Datum a čas poslední aktualizace serveru. 9.4.2022, 12:24:02 PM
Celkový počet virtuálních počítačů Počet virtuálních počítačů v uzlu serveru v rámci clusteru. 1 ze 2 spuštěných
Spuštěno Počet virtuálních počítačů spuštěných v uzlu serveru v rámci clusteru. 2
Zastaveno Počet virtuálních počítačů zastavených v uzlu serveru v rámci clusteru. 3
Neúspěšný Počet virtuálních počítačů, u které došlo k selhání v uzlu serveru v rámci clusteru. 2
Jiné Pokud je virtuální počítač v jednom z následujících stavů (Neznámý, Spouštění, Vytváření snímků, Ukládání, Zastavování, Pozastavení, Obnovení, Pozastaveno, Pozastaveno), považuje se za Jiný. 2

Storage

Toto zobrazení ukazuje stav svazků, využití a výkon napříč monitorovanými clustery. Rozbalením clusteru zobrazíte stav jednotlivých svazků. Toto zobrazení je sestaveno pomocí události svazku s ID 3002 kanálu Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. Dlaždice v horní části poskytují přehled o stavu úložiště.

Snímek obrazovky znázorňující stav svazků úložiště

Metric Popis Příklad
Svazek clusteru > Název clusteru. Při rozšíření se zobrazí svazky v rámci clusteru. AltaylCluster1 > ClusterPerformanceHistory
Naposledy aktualizované Datetimestamp poslední aktualizace úložiště. 14.4.2022, 14:58:55
Stav svazku Stav svazku. Může být v pořádku, upozornění, kritický nebo jiný. V pořádku
Velikost Celková kapacita zařízení v bajtech během sledovaného období. 25B
Využití Procento dostupné kapacity během sledovaného období. 23.54%
Iops Vstupně-výstupní operace za sekundu. 45/s
Trendovou Trend IOPS
Propustnost Počet bajtů za sekundu, které Application Gateway obsloužil 5B/s
Trend (B/s) Trend propustnosti.
Průměrná latence Latence je průměrná doba potřebná k dokončení V/V požadavku. 334 μs

Přizpůsobení přehledů

Vzhledem k tomu, že uživatelské prostředí je postavené na šablonách sešitů služby Azure Monitor, můžou uživatelé upravovat vizualizace a dotazy a ukládat je jako přizpůsobený sešit.

Pokud používáte vizualizaci z centra > Přehledy služby Azure Monitor > Azure Stack HCI, vyberte Přizpůsobit > Upravit > Uložit jako a uložte kopii upravené verze do vlastního sešitu.

Sešity se ukládají ve skupině prostředků. Každý, kdo má přístup ke skupině prostředků, má přístup k přizpůsobenému sešitu.

Většina dotazů se píše pomocí dotazovací jazyk Kusto (KQL). Některé dotazy se zapisují pomocí Resource Graph Query. Další informace najdete v následujících článcích:

Podpora

Pokud chcete otevřít lístek podpory pro Přehledy, použijte typ služby Insights pro Azure Stack HCI v části Monitorování & Správa.

Kanál protokolu událostí

Zobrazení přehledů a monitorování jsou založená na microsoft-Windows-SDDC-Management / kanálu provozního protokolu událostí Systému Windows. Pokud je povolené monitorování, ukládají se data z tohoto kanálu do pracovního prostoru služby Log Analytics.

Zobrazení a změna intervalu mezipaměti výpisu paměti

Výchozí interval pro výpis mezipaměti je nastavený na 3600 sekund (1 hodina).

K zobrazení hodnoty intervalu výpisu mezipaměti použijte následující rutiny PowerShellu:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Pomocí následujících rutin můžete změnit frekvenci výpisu mezipaměti. Pokud je nastavená hodnota 0, zastaví se publikování událostí:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Události Windows v kanálu protokolu

Tento kanál zahrnuje pět událostí. Každá událost má název clusteru a ID Resource Manager Azure jako EventData.

ID události Typ události
3000 Server
3001 Jednotky
3002 Svazek
3003 Virtuální počítač
3004 Cluster

Hodnota sloupce RenderedDescription události serveru 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Většina proměnných je z těchto informací JSON srozumitelná. V následující tabulce je ale uvedeno několik proměnných, jejichž pochopení je trochu obtížnější.

Proměnná Popis
m_servers Pole uzlů serveru.
m_statusCategory Stav serveru.
m_status Stav serveru. Jedná se o pole, které může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0-4). Druhá hodnota je volitelná (5–9).

Hodnoty proměnné m_statusCategory jsou následující:

Hodnota Význam
0 V pořádku
1 Upozornění
2 Není v pořádku
255 Jiné

Hodnoty proměnné m_status jsou následující:

Hodnota Význam
0 Nahoru
1 Dolů
2 Při údržbě
3 Připojení
4 Normální
5 Isolated
6 V karanténě
7 Odvodnění
8 Odtok dokončen
9 Vyprázdnění selhalo
0xffff Neznámý

Hodnota sloupce RenderedDescription události jednotky 3001

Událost jednotky 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Hodnota sloupce RenderedDescription události svazku 3002

Událost svazku 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Většina proměnných je vysvětlená z výše uvedených informací JSON. V následující tabulce je ale uvedeno několik proměnných, jejichž pochopení je trochu obtížnější.

Proměnná Popis
Seznam svazků Pole svazků.
m_StatusCategory Stav svazku.
m_Status Stav svazku. Jedná se o pole, které může obsahovat jednu nebo dvě hodnoty. První hodnota je povinná (0-4). Druhá hodnota je volitelná (5–9).

Hodnoty proměnné m_statusCategory jsou následující:

Hodnota Význam
0 V pořádku
1 Upozornění
2 Není v pořádku
255 Jiné

Hodnoty proměnné m_status jsou následující:

Hodnota Význam
0 Neznámý
1 Jiné
2 OK
3 Potřebuje opravu
4 Zdůraznil
5 Prediktivní selhání
6 Chyba
7 Neopravitelná chyba
8 Spouštění
9 Zastavování
10 Zastaveno
11 V provozu
12 Žádný kontakt
13 Ztráta komunikace
14 Bylo přerušeno
15 Spící
16 Podpůrná entita se stala chybou
17 Dokončeno
18 Režim napájení
19 Přemístění
0xD002 Dolů
0xD003 Vyžaduje opětovnou synchronizaci

Hodnota sloupce RenderedDescription události virtuálního počítače 3003

Událost virtuálního počítače 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Hodnota sloupce RenderedDescription události clusteru 3004

Událost clusteru 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Další informace o shromažďovaných datech najdete v tématu Chyby služby Health Service.

Další kroky

Související informace najdete tady: