Gestione di anomalie

Questo articolo illustra la funzionalità di gestione delle anomalie all'interno di FinOps Framework e come implementare tale funzionalità in Microsoft Cloud.


Definizione

La gestione delle anomalie si riferisce alla pratica di rilevare e risolvere in modo tempestivo modelli di utilizzo e costi anomali o imprevisti.

Usare strumenti automatizzati per rilevare le anomalie e inviare notifiche agli stakeholder. Esaminare periodicamente le tendenze di utilizzo per rivelare anomalie che gli strumenti automatizzati potrebbero perdere.

Per individuare la causa radice dell'anomalia, esaminare le modifiche apportate ai comportamenti dell'applicazione, all'utilizzo delle risorse e alla configurazione delle risorse.

Con un approccio sistematico al rilevamento, all'analisi e alla risoluzione delle anomalie, le organizzazioni possono ridurre al minimo i costi imprevisti che influiscono sui budget e sulle operazioni aziendali. E possono anche identificare e prevenire eventi imprevisti relativi alla sicurezza e all’affidabilità che possono emergere nei dati dei costi.


Introduzione

Quando si iniziano a gestire i costi nel cloud, si usano gli strumenti nativi disponibili nel portale.

  • Iniziare con gli avvisi proattivi.
    • Sottoscrivere avvisi di anomalia per ogni sottoscrizione nell'ambiente per ricevere avvisi di posta elettronica quando viene rilevato un picco o un calo insolito nell'utilizzo normalizzato in base all'utilizzo cronologico.
    • Prendere in considerazione di Sottoscrivere gli avvisi pianificati per condividere un grafico delle tendenze dei costi con gli stakeholder. Può essere utile per aumentare la consapevolezza quando i costi cambiano nel tempo e potrebbero potenzialmente rilevare le modifiche che il modello di anomalie potrebbe perdere.
    • Per tenere traccia dell'ambito o del carico di lavoro specifico, è consigliabile creare un budget in Gestione costi. Specificare i filtri e impostare gli avvisi per i costi effettivi e i costi previsti della destinazione con granularità fine.
  • Esaminare periodicamente i costi, usando dettagli sui costi, analisi dell'utilizzo e visualizzazioni per identificare potenziali anomalie che potrebbero non essere rilevate.
  • Dopo aver identificato un'anomalia, eseguire le azioni appropriate per risolverla.
    • Esaminare i dettagli delle anomalie con i tecnici che gestiscono le risorse cloud correlate. Alcune "anomalie" rilevate automaticamente sono pianificate o almeno note modifiche alla configurazione delle risorse come parte della creazione e della gestione dei servizi cloud.
    • Se sono necessari dettagli di utilizzo di livello inferiore, esaminare l'utilizzo delle risorse nelle Metriche di Monitoraggio di Azure.
    • Se sono necessari i dettagli delle risorse, esaminare le Modifiche alla configurazione delle risorse in Azure Resource Graph.

Partire dalle nozioni di base

A questo punto sono stati configurati gli avvisi automatizzati e idealmente sono state salvate le visualizzazioni e i report per semplificare i controlli periodici.

  • Stabilire e automatizzare gli indicatori KPI, ad esempio:
    • Numero di anomalie ogni mese o trimestre.
    • Impatto totale dei costi delle anomalie ogni mese o trimestre
    • Tempo di risposta per rilevare e risolvere le anomalie.
    • Numero di falsi positivi e falsi negativi.
  • Espandere la copertura del processo di rilevamento delle anomalie e di risposta per includere tutti i costi.
  • Definire, documentare e automatizzare i flussi di lavoro per guidare il processo di risposta quando vengono rilevate anomalie.
  • Promuovere una cultura basata sull'apprendimento continuo, sull'innovazione e sulla collaborazione.
    • Esaminare e perfezionare regolarmente i processi di gestione delle anomalie in base ai commenti e ai suggerimenti, alle procedure consigliate del settore e alle tecnologie emergenti.
    • Promuovere la condivisione delle conoscenze e la cooperazione interfunzionale per migliorare continuamente le funzionalità di rilevamento delle anomalie e di risposta.

Altre informazioni su FinOps Foundation

Questa capacità fa parte di FinOps Framework di FinOps Foundation, un'organizzazione senza fine di lucro dedicata al progresso della gestione e dell'ottimizzazione dei costi del cloud. Per altre informazioni su FinOps, inclusi playbook utili, programmi di formazione e certificazione e altro ancora, vedere l'articolo Funzionalità di gestione anomalie nella documentazione di FinOps Framework.

Puoi anche trovare video correlati sul canale YouTube di FinOps Foundation:


Funzionalità FinOps correlate:

Prodotti correlati:

Soluzioni correlate: