Checklista för designgranskning för tillförlitlighet
Den här checklistan innehåller en uppsättning rekommendationer som du kan använda för att utvärdera strategierna för tillförlitlighet, återhämtning och felåterställning i arkitekturdesignen. Identifiera den bästa infrastrukturen och programdesignen för din arbetsbelastning för att säkerställa tillförlitligheten. Fatta dessa beslut baserat på dina affärskrav som är mappade till målmått för tillgänglighet och återställning.
Om du vill implementera en tillförlitlig design bör du noggrant överväga beslutspunkter i din design och vara medveten om hur dessa beslut påverkar din arbetsbelastning. Den här checklistan och tillhörande guider innehåller resurser som hjälper dig att fatta dessa beslut. Gör arbetsbelastningens tillförlitlighet till ett centralt övervägande under hela livscykeln för arbetsbelastningsdesign, utveckling och drift.
Checklista
Använd din design med fokus på tillförlitlighet för att säkerställa att du utformar en arbetsbelastning som är motståndskraftig, hanterbar och repeterbar. Om du inte inkluderar tillförlitlighetsmetoder och överväger kompromisserna är din design potentiellt i riskzonen. Överväg noggrant alla punkter som beskrivs i checklistan för att ingjuta förtroende för systemets framgång.
Kod | Rekommendation | |
---|---|---|
☐ | RE:01 | Utforma din arbetsbelastning så att den överensstämmer med affärsmålen och undvik onödig komplexitet eller omkostnader. Använd en praktisk och balanserad metod för att fatta designbeslut som ger önskat resultat. Begränsa designen till nödvändigheterna för att minska ineffektiviteten och potentiella problem. |
☐ | RE:02 | Identifiera och betygsätta användar- och systemflöden. Använd en allvarlighetsskala baserat på dina affärskrav för att prioritera flödena. |
☐ | RE:03 | Använd analys av felläge (FMA) för att identifiera och prioritera potentiella fel i lösningskomponenterna. Utför FMA för att hjälpa dig att bedöma risken och effekten av varje felläge. Fastställa hur arbetsbelastningen svarar och återställs. |
☐ | RE:04 | Definiera tillförlitlighets- och återställningsmål för komponenterna, flödena och den övergripande lösningen. Visualisera målen för att förhandla, få konsensus, ange förväntningar och driva åtgärder för att uppnå det ideala tillståndet. Använd de definierade målen för att skapa hälsomodellen. Hälsomodellen definierar hur felfria, degraderade och ej felfria tillstånd ser ut. |
☐ |
RE:05 RE:05 RE:05 |
Lägg till redundans på olika nivåer, särskilt för kritiska flöden. Tillämpa redundans på beräknings-, data-, nätverks- och andra infrastrukturnivåer i enlighet med de identifierade tillförlitlighetsmålen. |
☐ |
RE:06 RE:06 |
Implementera en strategi för aktuell och tillförlitlig skalning på program-, data- och infrastrukturnivå. |
☐ |
RE:07 RE:07 RE:07 |
Förbättra återhämtning och återställning av din arbetsbelastning genom att implementera självbevarelsedrift och självåterställningsåtgärder. Skapa funktioner i lösningen med hjälp av infrastrukturbaserade tillförlitlighetsmönster och programvarubaserade designmönster för att hantera komponentfel och tillfälliga fel. Skapa funktioner i systemet för att identifiera lösningskomponentfel och initiera automatiskt korrigerande åtgärder medan arbetsbelastningen fortsätter att fungera med fullständig eller nedsatt funktionalitet. |
☐ | RE:08 | Testa för återhämtnings- och tillgänglighetsscenarier genom att tillämpa principerna för kaosteknik i dina test- och produktionsmiljöer. Använd testning för att säkerställa att implementerings- och skalningsstrategierna för den graciösa försämringen är effektiva genom att utföra aktiva fel och simulerad belastningstestning. |
☐ | RE:09 | Implementera strukturerade, testade och dokumenterade planer för affärskontinuitet och haveriberedskap (BCDR) som överensstämmer med återställningsmålen. Planerna måste omfatta alla komponenter och systemet som helhet. |
☐ | RE:10 | Mät och modellera lösningens hälsosignaler. Samla kontinuerligt in drifttid och andra tillförlitlighetsdata från hela arbetsbelastningen och även från enskilda komponenter och nyckelflöden. |
Nästa steg
Vi rekommenderar att du granskar tillförlitlighetsavvägningarna för att utforska andra begrepp.