Well-Architected Framework di Azure per carichi di lavoro di dati

La metodologia di pianificazione di questo scenario descrive un processo che consente di razionalizzare l'ambiente dati, assegnare priorità alle attività tecniche e identificare i carichi di lavoro di dati. Per molti dei carichi di lavoro denominati, è importante rispettare un set di principi architetturali. Questi principi guidano lo sviluppo e l'ottimizzazione dei carichi di lavoro. I cinque costrutti dell'architettura sono descritti in dettaglio in Well-Architected Framework di Azure. Queste linee guida offrono un riepilogo delle procedure di applicazione di questi principi alla gestione dei carichi di lavoro di dati.

Ottimizzazione dei costi

È essenziale progettare avendo in mente lo strumento giusto per la soluzione giusta. Questa entità di sicurezza consente di analizzare la spesa nel tempo. Consente anche di analizzare la possibilità di aumentare o diminuire il numero di istanze in base alle esigenze. Per i carichi di lavoro di dati, prendere in considerazione la riusabilità, il ridimensionamento su richiesta, la riduzione della duplicazione dei dati e la possibilità di sfruttare i vantaggi del servizio Azure Advisor.

Per altre informazioni, vedere Elenco di controllo per la revisione della progettazione per l'ottimizzazione dei costi.

Efficienza prestazionale

La soddisfazione degli utenti dipende dalle prestazioni dei carichi di lavoro. Le prestazioni possono variare in base a fattori esterni. È fondamentale raccogliere continuamente i dati di telemetria sulle prestazioni e reagire il più rapidamente possibile. Basarsi sui controlli ambientali condivisi per la gestione e il monitoraggio per creare avvisi, dashboard e notifiche specifici per le prestazioni del proprio carico di lavoro. Le considerazioni principali sono:

  • Astrazione di archiviazione e calcolo
  • Scalabilità dinamica
  • Partizionamento
  • Eliminazione dell'archiviazione
  • Driver ottimizzati
  • Cache a più livelli

Per maggiori informazioni, consultare la sezione Elenco di controllo per la revisione della progettazione per l'efficienza delle prestazioni.

Eccellenza operativa

La gestione operativa dei carichi di lavoro di dati può includere un'automazione avanzata che migliora la capacità di rispondere rapidamente agli eventi. È possibile basarsi su operazioni sui dati centralizzate grazie all'automazione dei processi specifici del carico di lavoro, a test automatizzati e alla coerenza. Per l'intelligenza artificiale, considerare l'uso del framework MLOps condiviso come parte del normale ciclo di rilascio.

Per maggiori informazioni, consultare la sezione Elenco di controllo per la revisione della progettazione per l'eccellenza operativa.

Sicurezza

La sicurezza e la gestione dei dati devono essere integrate nel processo architetturale a livelli per ogni applicazione e ogni carico di lavoro. L'analisi su scala cloud è incentrata sulla definizione di una base per la sicurezza. Questa base viene creata quando si configurano le zone di destinazione di Azure e le si gestiscono separatamente dal carico di lavoro. Tuttavia, il team del carico di lavoro è comunque responsabile della convalida dei seguenti requisiti minimi. Se necessario, potrebbero essere richieste soluzioni specifiche del carico di lavoro per aumentare la configurazione dell'ambiente.

  • Garantire la riservatezza e l'integrità dei dati attraverso, ad esempio la gestione dei privilegi, la privacy dei dati e la definizione di controlli appropriati.
  • Implementare in modo appropriato l'isolamento della rete, la crittografia end-to-end, il controllo e i criteri a livello di piattaforma.
  • Usare l'integrazione dell'accesso Single Sign-On (SSO), l'accesso condizionale supportato dall'autenticazione a più fattori e le identità del servizio gestito.
  • Rispettare la separazione dei problemi, ad esempio tra il riquadro di controllo e il piano dati, applicando in modo appropriato il controllo degli accessi in base al ruolo e, laddove possibile, il controllo degli accessi in base agli attributi.
  • Assicurarsi che il team del carico di lavoro sia coinvolto nella valutazione regolare o continua della vulnerabilità, nella protezione dalle minacce e nel monitoraggio della conformità.
  • Proteggere i dati

Per maggiori informazioni, consultare la sezione Elenco di controllo per la revisione della progettazione per la sicurezza.

Affidabilità

Tutto è a rischio di interruzione e le pipeline di dati non fanno eccezione. Per questo motivo, le architetture migliori sono progettate considerando la disponibilità e la resilienza come priorità. Le considerazioni principali sono la velocità con cui è possibile rilevare le modifiche e la velocità con cui si possono riprendere le operazioni.

L'ambiente dati deve prendere in considerazione le architetture resilienti, le ridondanze tra aree, il livello di servizio, i contratti di servizio e il supporto critico. L'ambiente esistente deve includere anche il controllo, il monitoraggio e la generazione di avvisi usando il monitoraggio integrato e un framework di notifica.

Oltre a questi controlli ambientali, il team del carico di lavoro deve considerare:

  • Altre modifiche dell'architettura per migliorare i contratti di servizio
  • Ridondanza dell'architettura specifica del carico di lavoro
  • Processi per il monitoraggio e la notifica oltre a quelli garantiti dai team delle operazioni cloud

Per maggiori informazioni, consultare la sezione Elenco di controllo per la revisione della progettazione per l'affidabilità.

Passaggi successivi