Vanliga frågor och svar: Behöver jag veta hur jag kodar för att engagera mig i SRE?

När individer överväger att engagera sig i SRE och team funderar på att införa SRE-metoder, är en vanlig fråga som kommer upp "Behöver du veta hur man kodar?"

Det korta svaret: ja.

Men det fullständiga svaret är lite mer nyanserat. Låt oss titta på tre platser där kodning spelar in inom platstillförlitlighetsteknik tillsammans med den nivå av kodningsexpertis som krävs för var och en. Den här listan är inte fullständig, men de här scenarierna är några av de vanligaste användningsfallen.

Scenario 1: Ta bort slit genom automatisering

Tekniker för platstillförlitlighet och andra som använder SRE-metoder försöker när det är möjligt att ta bort slit. "Toil" betyder en specifik sak i SRE. Toil refererar till åtgärder som utförs av en människa som har vissa egenskaper. Enahanda arbete har inget långvarigt inlösande värde. Det tar inte tjänsten framåt på något meningsfullt sätt. Det är ofta återkommande och huvudsakligen manuellt (även om det kan automatiseras). När tjänsten eller system blir större över tid ökar förmodligen också antalet begäranden för systemet i antal med en proportionell hastighet och kräva ännu mer manuellt arbete.

Om en tjänst till exempel kräver att SRE-teamet återställer något varje vecka eller etablerar nya konton och diskutrymme för hand eller upprepade gånger startar om det för hand – det här är driftbelastningen som slits. Genomförandet av de här åtgärderna har inte gjort tjänsten bättre på något långsiktigt, beständigt sätt. Dessa åtgärder måste förmodligen upprepas flera gånger.

SRE:er hatar enahanda arbete. De arbetar för att ta bort det när det är möjligt och lämpligt. Det här är en av de platser där automatisering blir aktuellt i SRE. Om dessa begäranden kan hanteras automatiskt frigör det teamet att arbeta med mer givande och effektfulla saker.

Kodningsexpertis: automatisering kräver viss kodningsexpertis, men den behöver inte kräva fullständiga kunskaper om programvaruteknik. Om du kan skriva små skript (kanske i PowerShell eller Bourne-gränssnittet) eller om du skapar en Azure-logikapp med knappt någon kod kan den här appen fortfarande hjälpa till att eliminera slit.

Scenario 2: Styra via API:er/domänspecifika språk (DSL:er)/mallar

Även om det inte är absolut nödvändigt för SRE-arbete kan SRE:er skala upp sitt arbete genom att kunna styra miljöer via API:er, DSL:er och mallar (särskilt molnmiljöer). Etablering/avetableringsinfrastruktur, konfiguration av övervakning och integrering av flera tjänster blir mycket effektivare via kodning.

Kodningsexpertis: precis som i det föregående scenariot kräver detta viss kodningsexpertis, men det behöver inte kräva fullständiga kunskaper om programvaruteknik. Utöver de skript och logikappar som nämnts tidigare kan Azure Resource Manager-mallar också användas med minimal kodning.

Scenario 3: Åtgärda koden

Tekniker för platstillförlitlighet vill förbättra systemets tillförlitlighet. Det här målet kräver ibland att du undersöker källkoden för ett system, bestämmer problemet och ofta bidrar med en korrigering tillbaka till kodbasen. Även om graden av sofistikering av detta arbete kan variera kraftigt beroende på situationen, är kodningsexpertis ett definitivt krav i dessa fall.

Kodningsexpertis: fullständig expertis inom programvaruteknik krävs ofta i det här scenariot.

Nästa steg

Vill du veta mer om platstillförlitlighetsutveckling och lågkodsarbete? Kolla in vår hubb för tillförlitlighetsteknik, produktdokumentationen som länkats ovan.