Chaos-Experimente

In Azure Chaos Studio erstellen Sie Chaos-Experimente und führen sie aus. Ein Chaos-Experiment ist eine Azure-Ressource, die die Fehler beschreibt, die ausgeführt werden sollen, und die Ressourcen, für die diese Fehler ausgeführt werden sollen.

Ein Experiment ist in zwei Abschnitte unterteilt:

  • Selektoren: Selektoren sind Gruppen von Zielressourcen, für die Fehler oder andere Aktionen ausgeführt werden. Mit einem Selektor können Sie Ressourcen logisch gruppieren, um sie für mehrere Aktionen wiederzuverwenden.

    Beispielsweise können Sie über einen Selektor mit dem Namen AllNonProdEastUSVMs verfügen, in dem Sie alle nicht für die Produktion bestimmten virtuellen Computer in „USA, Osten“ hinzugefügt haben. Anschließend können Sie die CPU-Auslastung gefolgt von der Auslastung des virtuellen Speichers auf diese virtuellen Computer anwenden, indem Sie auf den Selektor verweisen.

  • Logik: Der Rest des Experiments beschreibt, wie und wann Fehler ausgeführt werden. Ein Experiment ist in Schritte unterteilt, die nacheinander ausgeführt werden. Jeder Schritt verfügt über mindestens eine Verzweigung, die gleichzeitig ausgeführt wird. Mit Schritten und Verzweigungen können Sie mehrere Fehler ressourcenübergreifend in Ihre Umgebung parallel einspeisen.

    Jede Verzweigung verfügt über eine oder mehrere Aktionen, bei denen es sich entweder um die Fehler handelt, die Sie ausführen möchten, oder um Zeitverzögerungen. Fehler sind Aktionen, die zu Unterbrechungen führen. Die meisten Fehler nehmen einen oder mehrere Parameter an, z. B. die Dauer der Ausführung des Fehlers oder die zu übernehmende Belastung.

Diagramm des Layouts eines Chaos-Experiments.

Abonnementübergreifende und inhaberübergreifende Experimente

Ein Chaos-Experiment ist eine Azure-Ressource, die in einem Abonnement, einer Ressourcengruppe und einer Region bereitgestellt wird. Sie können das Azure-Portal oder die Chaos Studio-REST-API verwenden, um ein Experiment zu erstellen, zu aktualisieren, zu starten, abzubrechen und dessen Status anzuzeigen.

Chaos-Experimente können auf Ressourcen in einem anderen Abonnement als das Experiment abzielen, solange sich das Abonnement innerhalb desselben Azure-Mandanten befindet. Chaos-Experimente können auf Ressourcen in einer anderen Region als das Experiment abzielen, solange die Region eine unterstützte Region für Chaos Studio ist.

Dokumentieren von Chaos-Experimenten

Es gibt mehrere wichtige Aspekte Ihres Chaosexperimentprozesses, die Sie im Laufe der Zeit nachverfolgen und ändern können. Ein Ansatz besteht darin, Arbeitsaufgaben in Azure Boards oder in GitHub-Projekten zu verwenden. Indem Sie dedizierte Arbeitsaufgaben für jedes Experiment erstellen, können Sie die Details, den Fortschritt und die Ergebnisse Ihrer Experimente auf strukturierte Weise nachverfolgen. Diese Dokumentation kann Informationen wie den Zweck des Experiments, die erwarteten Ergebnisse, die befolgten Schritte, die beteiligten Ressourcen und alle Beobachtungen oder Erkenntnisse aus dem Experiment enthalten.

Element Details
entwickeln Definieren des Ziels und der erwarteten Ergebnisse des Experiments
Zielbereich Ermitteln Sie, welcher Teil des Systems Chaos-Experimenten unterzogen wird (z. B. Netzwerk, Datenbank, Anwendungsschicht).
Duration Geben Sie den Zeitrahmen für das Chaos-Experiment an.
Ziel Bestimmen Sie die spezifischen Ziele oder Komponenten innerhalb des Systems.
Environment Definieren Sie, ob das Experiment in einer Produktions-, Staging- oder Entwicklungsumgebung durchgeführt wird.
Beobachtungen Zeichnen Sie während des Experiments beobachtete Daten oder Verhaltensweisen auf.
Ergebnisse Fassen Sie die Ergebnisse des Experiments zusammen.
Aktionselemente Listen Sie alle Aktionen oder Schritte auf, die basierend auf den Ergebnissen ausgeführt werden sollen.

Die Hypothese ist ein entscheidender Aspekt eines Chaosexperiments, da sie das Ziel und die erwarteten Ergebnisse des Experiments definiert. Dies hilft beim Testen der Fähigkeit des Systems, unerwartete Unterbrechungen effektiv zu behandeln. Indem Sie eine klare Hypothese formulieren, können Sie das Experiment auf bestimmte Bereiche des Systems konzentrieren und aussagekräftige Daten sammeln, um die Resilienz zu bewerten. Durch die Nutzung der Features von Azure Boards oder GitHub-Projekten können Sie mit Ihrem Team zusammenarbeiten, Aufgaben zuweisen, Fälligkeitsdaten festlegen und den Gesamtfortschritt Ihrer Chaos Engineering-Initiativen nachverfolgen.

Nächste Schritte

Nachdem Sie nun wissen, was ein Chaos-Experiment ist, sind Sie bereit hierfür: