Datalivscykelhantering
Datalivscykelhantering är en metod för att använda vissa principer för att effektivt hantera data under hela den tid de finns i systemet. Dessa principer bör bestå av övergripande lagrings- och dataprinciper som driver dina datahanteringsprocesser. Eftersom affärsmål och drivrutiner dikterar principer för hantering av datalivscykler är de vanligtvis knutna till ett ramverk för övergripande avtal om IT-styrning och hantering och servicenivå.
När du vet vilken typ av data du har och hur de kommer att användas vet du redan dess mest sannolika utveckling och öde. Du behöver förstå hur dina data utvecklas, bestämma hur de växer, övervaka ändringar i användningen över tid, bestämma hur länge de ska finnas och följa alla regler som gäller för dessa data.
Datalivscykelhantering tillgodoser dessa behov med hjälp av en kombination av processer, principer och programvara så att dina team kan använda lämplig teknik för varje fas i dina datas livscykel.
Livscykel för data
Dataprodukter kan ha olika livscykeler. I ett typiskt livscykelmönster används och används nyligen inmatade data ofta. När dess ålder ökar minskar ofta åtkomstfrekvensen, och äldre data ser en drastisk minskning av användningen.
Datalivscykler kan dock skilja sig från det här vanliga mönstret. Vissa data förblir oanvända efter den inledande inmatningen eller används sällan när de har lagrats. Vissa dataprodukter kan upphöra att gälla dagar eller månader efter att de har skapats, medan andra dataprodukter används aktivt och ändras under hela livslängden.
De flesta platser har regler som avgör hur länge du måste lagra data, till exempel personliga data och redovisningsdata. Ett visst land/en viss region kan kräva att du behåller den primära dokumentationen fem år för data, till exempel inkommande och utgående fakturor, saldon för kontantbok, bankkuponger och lönebesked. Det kan också kräva att sekundär dokumentation behålls i tre till fem år, vilket inkluderar saker som brev, avtal och anteckningar.
Hantera datalivscykler
Det finns två sätt att hantera datalivscykeln i analys i molnskala.
- Du kan använda inbyggda datalivscykelfunktioner för varje Azure-tjänst som innehåller beständiga data, till exempel Azure Data Lake. Den här metoden är bra för att flytta data till kall- och arkivnivåer, men det går inte att se till att data tas bort efter en angiven tidsperiod.
Viktigt!
Arkivnivån stöds för närvarande inte för zonredundanta lagringskonton. Mer information finns i dataredundans.
- Du kan integrera datalivscykeln i en registreringsprocess, vilket ger programföretagsägare möjlighet att definiera sin policy för datalivscykel. Den här processen omfattar ett anpassat program för att samla in viktiga mått i metadatastandarder för varje dataprodukt. En del av den här metoden handlar om att flytta data från frekvent till kall till arkivering, och säkerställer borttagning av data efter en angiven tidsperiod.