Gestione di anomalie
Questo articolo illustra la funzionalità di gestione delle anomalie all'interno di FinOps Framework e come implementare tale funzionalità in Microsoft Cloud.
Definizione
La gestione delle anomalie si riferisce alla pratica di rilevare e risolvere in modo tempestivo modelli di utilizzo e costi anomali o imprevisti.
Usare strumenti automatizzati per rilevare le anomalie e inviare notifiche agli stakeholder. Esaminare periodicamente le tendenze di utilizzo per rivelare anomalie che gli strumenti automatizzati potrebbero perdere.
Per individuare la causa radice dell'anomalia, esaminare le modifiche apportate ai comportamenti dell'applicazione, all'utilizzo delle risorse e alla configurazione delle risorse.
Con un approccio sistematico al rilevamento, all'analisi e alla risoluzione delle anomalie, le organizzazioni possono ridurre al minimo i costi imprevisti che influiscono sui budget e sulle operazioni aziendali. E possono anche identificare e prevenire eventi imprevisti relativi alla sicurezza e all’affidabilità che possono emergere nei dati dei costi.
Introduzione
Quando si iniziano a gestire i costi nel cloud, si usano gli strumenti nativi disponibili nel portale.
- Iniziare con gli avvisi proattivi.
- Sottoscrivere avvisi di anomalia per ogni sottoscrizione nell'ambiente per ricevere avvisi di posta elettronica quando viene rilevato un picco o un calo insolito nell'utilizzo normalizzato in base all'utilizzo cronologico.
- Prendere in considerazione di Sottoscrivere gli avvisi pianificati per condividere un grafico delle tendenze dei costi con gli stakeholder. Può essere utile per aumentare la consapevolezza quando i costi cambiano nel tempo e potrebbero potenzialmente rilevare le modifiche che il modello di anomalie potrebbe perdere.
- Per tenere traccia dell'ambito o del carico di lavoro specifico, è consigliabile creare un budget in Gestione costi. Specificare i filtri e impostare gli avvisi per i costi effettivi e i costi previsti della destinazione con granularità fine.
- Esaminare periodicamente i costi, usando dettagli sui costi, analisi dell'utilizzo e visualizzazioni per identificare potenziali anomalie che potrebbero non essere rilevate.
- Usare le visualizzazioni intelligenti in Analisi dei costi per esaminare le informazioni dettagliate sulle anomalie rilevate automaticamente per ogni sottoscrizione.
- Usare le visualizzazioni personalizzabili in Analisi dei costi per trovare manualmente modifiche impreviste.
- Si consiglia di salvare le visualizzazioni personalizzate che mostrano i costi nel tempo per carichi di lavoro specifici per risparmiare tempo.
- Prendere in considerazione di creare report di utilizzo più dettagliati usando Power BI.
- Dopo aver identificato un'anomalia, eseguire le azioni appropriate per risolverla.
- Esaminare i dettagli delle anomalie con i tecnici che gestiscono le risorse cloud correlate. Alcune "anomalie" rilevate automaticamente sono pianificate o almeno note modifiche alla configurazione delle risorse come parte della creazione e della gestione dei servizi cloud.
- Se sono necessari dettagli di utilizzo di livello inferiore, esaminare l'utilizzo delle risorse nelle Metriche di Monitoraggio di Azure.
- Se sono necessari i dettagli delle risorse, esaminare le Modifiche alla configurazione delle risorse in Azure Resource Graph.
Partire dalle nozioni di base
A questo punto sono stati configurati gli avvisi automatizzati e idealmente sono state salvate le visualizzazioni e i report per semplificare i controlli periodici.
- Stabilire e automatizzare gli indicatori KPI, ad esempio:
- Numero di anomalie ogni mese o trimestre.
- Impatto totale dei costi delle anomalie ogni mese o trimestre
- Tempo di risposta per rilevare e risolvere le anomalie.
- Numero di falsi positivi e falsi negativi.
- Espandere la copertura del processo di rilevamento delle anomalie e di risposta per includere tutti i costi.
- Definire, documentare e automatizzare i flussi di lavoro per guidare il processo di risposta quando vengono rilevate anomalie.
- Promuovere una cultura basata sull'apprendimento continuo, sull'innovazione e sulla collaborazione.
- Esaminare e perfezionare regolarmente i processi di gestione delle anomalie in base ai commenti e ai suggerimenti, alle procedure consigliate del settore e alle tecnologie emergenti.
- Promuovere la condivisione delle conoscenze e la cooperazione interfunzionale per migliorare continuamente le funzionalità di rilevamento delle anomalie e di risposta.
Altre informazioni su FinOps Foundation
Questa capacità fa parte di FinOps Framework di FinOps Foundation, un'organizzazione senza fine di lucro dedicata al progresso della gestione e dell'ottimizzazione dei costi del cloud. Per altre informazioni su FinOps, inclusi playbook utili, programmi di formazione e certificazione e altro ancora, vedere l'articolo Funzionalità di gestione anomalie nella documentazione di FinOps Framework.
Puoi anche trovare video correlati sul canale YouTube di FinOps Foundation:
Contenuto correlato
Funzionalità FinOps correlate:
Prodotti correlati:
Soluzioni correlate: