Organizzare i membri del team di operazioni dei dati

L'architettura di analisi su scala cloud è stata progettata con un set di principi fondamentali.

Principi fondamentali

  • Abilitazione self-service: consentire ai team di progetto di lavorare in autonomia per favorire metodi di sviluppo agili.

  • Governance: applicare protezioni alla piattaforma di Azure per garantire che i team di progetto visualizzino, modifichino ed eseguano le funzioni in base alle autorizzazioni.

  • Distribuzioni semplificate: garantire la disponibilità di criteri comuni all'interno dell'organizzazione per favorire una rapida scalabilità dei team e assistere i team con meno esperienza in alcune progettazioni e artefatti di base.

Ruoli e team

Nell'analisi su scala cloud è necessario allontanarsi da team orizzontalmente siloed, a team di cross-dominio verticale agile. Il team operativo dei dati si concentra sulla guida della governance al controllo normale mentre i team delle applicazioni dati si concentrano sulla creazione di dati come prodotto. Ciò può significare che l'organizzazione cambia un modello più allineato allo sviluppo di applicazioni. Ad esempio, ogni applicazione dispone di un proprietario del prodotto, che prevede requisiti e lavora con il team cross-domain per distribuire un prodotto. In questo caso, il prodotto è dati per il consumo.

Per altre informazioni, vedere Comprendere i ruoli e i team per l'analisi su scalabilità cloud in Azure

Distribuzione e operazioni

Il processo di distribuzione e il modello di operazioni sui dati (DataOps) sono una parte essenziale che supporta alcuni di questi principi di base. Le linee guida seguenti sono consigliate per allineare le organizzazioni ai principi:

  • Usare l'infrastruttura come codice.
  • Distribuire modelli applicabili ai principali casi d'uso all'interno dell'azienda.
  • Seguire un processo di distribuzione che includa una strategia per fork di GitHub e rami.
  • Gestire un repository centrale e distribuire le zone di destinazione per la gestione dei dati.

I collaboratori con competenze identificabili e singole devono stabilire un gruppo di piattaforme per gestire centralmente l'infrastruttura della piattaforma dati e creare e distribuire parti comuni dell'infrastruttura di dati per la zona di destinazione della gestione dati e per altre zone di destinazione dei dati. Il gruppo di piattaforme può anche creare, possedere e fornire una tecnologia agnostica che consente ai team dell'applicazione dati di acquisire, elaborare, archiviare e gestire le applicazioni dati.

Il team deve presentare i propri servizi in modalità self-service, che può includere strumenti per l'archiviazione di Big Data, il controllo delle versioni dei dati dei prodotti, l'organizzazione/implementazione della pipeline di dati, la de-identificazione dei dati e altro ancora. Questi tipi di strumenti sono fondamentali per ridurre al minimo i colli di bottiglia nel flusso di lavoro e il lead time per la creazione di nuovi prodotti di dati.

Il gruppo di piattaforme deve seguire le procedure consigliate descritte in questa sezione per raggiungere i propri obiettivi. Altri team dei prodotti di dati devono usare le procedure consigliate negli articoli successivi per testare e automatizzare i dati.

Per altre informazioni, vedere Automazione DevOps per l'analisi su scalabilità cloud in Azure

Passaggi successivi

Informazioni sui team per l'analisi su scala cloud in Azure