Gestione del danneggiamento dei dati in Microsoft 365
Uno degli aspetti complessi dell'esecuzione di un servizio cloud su larga scala è come gestire il danneggiamento dei dati, dato l'elevato volume di dati e sistemi indipendenti. Il danneggiamento dei dati può essere causato da:
- Bug dell'applicazione o dell'infrastruttura, che danneggiano parte o tutto lo stato dell'applicazione
- Problemi hardware che comportano la perdita di dati o l'impossibilità di leggere i dati
- Errori operativi umani
- Utenti malintenzionati e insider
- Eventi imprevisti nei servizi esterni che comportano una perdita di dati
Poiché una maggiore resilienza nell'integrità dei dati comporta un minor numero di eventi imprevisti di danneggiamento dei dati, Microsoft ha integrato meccanismi di protezione di Microsoft 365 per evitare il danneggiamento e sistemi e processi che consentono di recuperare i dati in caso affermativo. I controlli e i processi esistono nelle varie fasi del processo di rilascio della progettazione per aumentare la resilienza contro il danneggiamento dei dati, tra cui:
- Progettazione del sistema
- Organizzazione e struttura del codice
- Revisione del codice
- Unit test, test di integrazione e test di sistema
- Test/cancelli dei cavi di viaggio
Negli ambienti di produzione di Microsoft 365, la replica peer tra data center garantisce che siano sempre presenti più copie in tempo reale di tutti i dati. Le immagini e gli script standard vengono usati per ripristinare i server persi e i dati replicati vengono usati per ripristinare i dati dei clienti. In Exchange Online, ogni cassetta postale è ospitata nei gruppi di disponibilità del database (DAG) e replicata in data center geograficamente separati all'interno della stessa area. Ogni database delle cassette postali ha quattro copie distribuite tra i data center all'interno del dag: una copia attiva, due copie aggiornate e una copia ritardata di 7 giorni usata nel raro caso di danneggiamento logico irreversibile. Per SharePoint e OneDrive, i file vengono scritti contemporaneamente in un'area del data center primaria e secondaria. Più tipi di checksum vengono archiviati nei metadati in un percorso separato rispetto ai file corrispondenti e vengono usati per garantire l'integrità dei dati in tutte le fasi del ciclo di vita dei dati.
A causa dei controlli e dei processi predefiniti per la resilienza dei dati, Microsoft gestisce solo i backup della documentazione del sistema informativo di Microsoft 365 (inclusa la documentazione relativa alla sicurezza), usando la replica predefinita in SharePoint e lo strumento di repository del codice interno, Source Depot. La documentazione di sistema viene archiviata in SharePoint e Source Depot contiene immagini di sistema e dell'applicazione. Sia SharePoint che Source Depot usano il controllo delle versioni e vengono replicati quasi in tempo reale.