Ошибки и действия в Azure Chaos Studio

В Azure Chaos Studio все действия, которые происходят в рамках эксперимента, называются действием. Наиболее распространенный тип действия — это ошибка. В этой статье описываются действия и ошибки и свойства каждого из них.

Действия эксперимента

Действие — это любое действие, оркестрованное в рамках эксперимента хаоса. Действия организованы по шагам и ветвям, что позволяет выполнять действия последовательно или параллельно. Каждое действие имеет следующие свойства:

  • Имя: конкретное действие, которое происходит. Имя обычно принимает форму URN для действия, например urn.
  • Тип: способ выполнения действия. Действия могут быть непрерывными или дискретными. Непрерывное действие выполняется в течение определенного периода времени. Пример применения давления ЦП в течение 10 минут. Дискретное действие происходит только один раз. Пример перезагрузки экземпляра Кэш Azure для Redis.

Типы действий

В Студии Хаоса есть два варианта действий:

  • Ошибки. Это действие приводит к нарушению одного или нескольких ресурсов.
  • Задержки времени: это действие "ожидает" без влияния на ресурсы. Это полезно для приостановки между сбоями, чтобы ждать, пока система будет затронута предыдущей ошибкой.

Ошибки

Ошибки являются наиболее распространенным действием в Chaos Studio. Сбои приводят к нарушению работы системы, что позволяет убедиться, что система эффективно обрабатывает это нарушение, не влияя на доступность.

Ошибки могут:

  • Быть разрушительным. Например, ошибка может убить процесс.
  • Применить давление. Например, ошибка может добавить давление виртуальной памяти.
  • Добавьте задержку.
  • Причина изменения конфигурации.

Помимо имени и типа, ошибки могут также иметь длительность, если непрерывная, и параметры. Параметры описывают, как должна применяться ошибка и относится к имени сбоя. Например, параметр для сбоя отработки отказа Azure Cosmos DB — это регион чтения, который будет повышен до области записи во время сбоя области записи. Некоторые параметры являются обязательными, а другие — необязательными.

Ошибки зависят от типа целевого объекта либо на основе агента, либо на основе службы. Для сбоя на основе агента требуется, чтобы агент Chaos Studio был установлен на виртуальной машине или масштабируемом наборе виртуальных машин. Агент доступен как для Windows, так и для Linux, но не все ошибки доступны в обеих операционных системах. Сведения о том, какие ошибки поддерживаются в каждой операционной системе, см . в библиотеке ошибок и действий Chaos Studio. Сбои непосредственной службы не требуют какого-либо агента. Они выполняются непосредственно в ресурсе Azure.

Ошибки также включают имя селектора, описывающего ресурсы, с которыми выполняется ошибка. Дополнительные сведения о селекторах см . в статье "Эксперименты Хаоса". Ошибка может повлиять только на ресурс, если ресурс был подключен в качестве целевого объекта и имеет соответствующую возможность сбоя в ресурсе.

Следующие шаги

Теперь, когда вы понимаете действия и ошибки, к которым вы готовы: