Dapr-Komponentenresilienz

Artikel
08/02/2024

Resilienzrichtlinien verhindern, erkennen und beheben proaktiv Fehler Ihrer Container-App. In diesem Artikel erfahren Sie, wie Sie Resilienzrichtlinien für Anwendungen anwenden, die Dapr für die Integration in verschiedene Clouddienste verwenden, z. B. Statusspeicher, Pub/Sub-Nachrichtenbroker, Geheimnisspeicher und vieles mehr.

Sie können Resilienzrichtlinien wie Wiederholungsversuche, Timeouts und Trennschalter für die folgenden ausgehenden und eingehenden Vorgangsrichtungen über eine Dapr-Komponente konfigurieren:

Ausgehende Vorgänge: Aufrufe vom Dapr-Seitenwagen zu einer Komponente, z. B.:
- Beibehalten oder Abrufen des Zustands
- Veröffentlichen einer Nachricht
- Aufrufen einer Ausgabebindung
Eingehende Vorgänge: Aufrufe vom Dapr-Seitenwagen zu Ihrer Container-App, z. B.:
- Abonnements beim Übermitteln einer Nachricht
- Eingabebindungen, die ein Ereignis bereitstellen

Der folgende Screenshot zeigt, wie eine Anwendung eine Wiederholungsrichtlinie verwendet, um zu versuchen, aus fehlgeschlagenen Anforderungen wiederherzustellen.

Diagramm, das die Resilienz für Container-Apps mit Dapr-Komponenten veranschaulicht.

Konfigurieren von Resilienzrichtlinien

Sie können auswählen, ob Resilienzrichtlinien mithilfe von Bicep, der CLI oder dem Azure-Portal erstellt werden sollen.

Im folgenden Beispiel zur Resilienz werden alle verfügbaren Konfigurationen veranschaulicht.

resource myPolicyDoc 'Microsoft.App/managedEnvironments/daprComponents/resiliencyPolicies@2023-11-02-preview' = {
  name: 'my-component-resiliency-policies'
  parent: '${componentName}'
  properties: {
    outboundPolicy: {
      timeoutPolicy: {
          responseTimeoutInSeconds: 15
      }
      httpRetryPolicy: {
          maxRetries: 5
          retryBackOff: {
            initialDelayInMilliseconds: 1000
            maxIntervalInMilliseconds: 10000
          }
      }
      circuitBreakerPolicy: {  
          intervalInSeconds: 15
          consecutiveErrors: 10
          timeoutInSeconds: 5     
      }  
    } 
    inboundPolicy: {
      timeoutPolicy: {
        responseTimeoutInSeconds: 15
      }
      httpRetryPolicy: {
        maxRetries: 5
        retryBackOff: {
          initialDelayInMilliseconds: 1000
          maxIntervalInMilliseconds: 10000
        }
      }
      circuitBreakerPolicy: {  
          intervalInSeconds: 15
          consecutiveErrors: 10
          timeoutInSeconds: 5     
      }  
    }
  }
}

Voraussetzungen

Melden Sie sich bei der Azure CLI an:

az login

Stellen Sie sicher, dass Sie über die neueste Version der Azure Container-Apperweiterung verfügen.

az extension show --name containerapp
az extension update --name containerapp

Erstellen bestimmter Richtlinien

Hinweis

Wenn bei der Erstellung oder Aktualisierung nicht alle Eigenschaften einer Richtlinie festgelegt werden, wendet die Befehlszeilenschnittstelle automatisch die empfohlenen Standardeinstellungen an. Legen Sie bestimmte Richtlinien mithilfe von Kennzeichnungen fest.

Erstellen Sie Resilienzrichtlinien, indem Sie auf eine einzelne Richtlinie abzielen. Führen Sie beispielsweise zum Erstellen der Outbound Timeout-Richtlinie den folgenden Befehl aus.

az containerapp env dapr-component resiliency create --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName --out-timeout 20

Eine vollständige Liste der Parameter finden Sie im CLI-Referenzhandbuch.

Erstellen von Richtlinien mit Resilienz-YAML

Um die Resilienzrichtlinien aus einer YAML-Datei anzuwenden führen Sie den folgenden Befehl aus:

az containerapp env dapr-component resiliency create --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName --yaml <MY_YAML_FILE>

Dieser Befehl übergibt die YAML-Datei der Resilienzrichtlinie, die ähnlich wie im folgenden Beispiel aussehen kann:

outboundPolicy:
  httpRetryPolicy:
    maxRetries: 5
    retryBackOff:
      initialDelayInMilliseconds: 1000
      maxIntervalInMilliseconds: 10000
  timeoutPolicy:
    responseTimeoutInSeconds: 15
  circuitBreakerPolicy:
    intervalInSeconds: 15
    consecutiveErrors: 10
    timeoutInSeconds: 5
inboundPolicy:
  httpRetryPolicy:
    maxRetries: 3
    retryBackOff:
      initialDelayInMilliseconds: 500
      maxIntervalInMilliseconds: 5000
  circuitBreakerPolicy:
    intervalInSeconds: 15
    consecutiveErrors: 10
    timeoutInSeconds: 5

Aktualisieren bestimmter Richtlinien

Aktualisieren Sie Ihre Resilienzrichtlinien, indem Sie auf eine einzelne Richtlinie abzielen. Führen Sie beispielsweise zum Aktualisieren des Antworttimeouts der Outbound Timeout-Richtlinie den folgenden Befehl aus.

az containerapp env dapr-component resiliency update --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName --out-timeout 20

Aktualisieren von Richtlinien mit Resilienz-YAML

Sie können auch vorhandene Resilienzrichtlinien aktualisieren, indem Sie die zuvor von Ihnen erstellte Resilienz-YAML aktualisieren.

az containerapp env dapr-component resiliency update --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName --yaml <MY_YAML_FILE>

Anzeigen von Richtlinien

Verwenden Sie den resiliency list-Befehl, um alle Resilienzrichtlinien auflisten, die einer Container-App angefügt sind.

az containerapp env dapr-component resiliency list --group MyResourceGroup --environment MyEnvironment --dapr-component-name MyDaprComponentName

Verwenden Sie den resiliency show-Befehl, um eine einzelne Richtlinie nach Namen anzuzeigen.

az containerapp env dapr-component resiliency show --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName

Löschen von Richtlinien

Um Resilienzrichtlinien zu löschen, führen Sie den folgenden Befehl aus.

az containerapp env dapr-component resiliency delete --group MyResourceGroup --name MyDaprResiliency --environment MyEnvironment --dapr-component-name MyDaprComponentName

Wichtig

Nachdem Sie alle Resilienzrichtlinien angewendet haben, müssen Sie Ihre Dapr-Anwendungen neu starten.

Richtlinienspezifikationen

Zeitlimits

Timeouts werden verwendet, um lang laufende Vorgänge frühzeitig zu beenden. Die Timeoutrichtlinie enthält die folgenden Eigenschaften.

properties: {
  outbound: {
    timeoutPolicy: {
        responseTimeoutInSeconds: 15
    }
  }
  inbound: {
    timeoutPolicy: {
        responseTimeoutInSeconds: 15
    }
  }
}

Metadaten	Erforderlich	Beschreibung	Beispiel
`responseTimeoutInSeconds`	Ja	Timeout, das auf eine Antwort der Dapr-Komponente wartet.	`15`

Retries

Definieren Sie eine httpRetryPolicy-Strategie für fehlgeschlagene Vorgänge. Die Wiederholungsrichtlinie enthält die folgenden Konfigurationen.

properties: {
  outbound: {
    httpRetryPolicy: {
        maxRetries: 5
        retryBackOff: {
          initialDelayInMilliseconds: 1000
          maxIntervalInMilliseconds: 10000
        }
    }
  }
  inbound: {
    httpRetryPolicy: {
        maxRetries: 5
        retryBackOff: {
          initialDelayInMilliseconds: 1000
          maxIntervalInMilliseconds: 10000
        }
    }
  } 
}

Metadaten	Erforderlich	Beschreibung	Beispiel
`maxRetries`	Ja	Maximale Wiederholungsversuche, die für eine fehlgeschlagene HTTP-Anforderung ausgeführt werden sollen.	`5`
`retryBackOff`	Ja	Überwachen Sie die Anforderungen, und beenden Sie den gesamten Datenverkehr für den betroffenen Dienst, wenn Timeout- und Wiederholungskriterien erfüllt sind.	Nicht zutreffend
`retryBackOff.initialDelayInMilliseconds`	Ja	Verzögerung zwischen dem ersten Fehler und dem ersten Wiederholungsversuch.	`1000`
`retryBackOff.maxIntervalInMilliseconds`	Ja	Maximale Verzögerung zwischen Wiederholungsversuchen.	`10000`

Trennschalter

Definieren Sie circuitBreakerPolicy, um Anforderungen zu überwachen, die erhöhte Fehlerraten verursachen, und beenden Sie den gesamten Datenverkehr für den betroffenen Dienst, wenn ein bestimmtes Kriterium erfüllt ist.

properties: {  
  outbound: {  
    circuitBreakerPolicy: {  
        intervalInSeconds: 15
        consecutiveErrors: 10
        timeoutInSeconds: 5     
    }  
  },  
  inbound: {  
    circuitBreakerPolicy: {  
        intervalInSeconds: 15
        consecutiveErrors: 10
        timeoutInSeconds: 5     
    }  
  }  
}

Metadaten	Erforderlich	Beschreibung	Beispiel
`intervalInSeconds`	Nein	Zyklischer Zeitraum (in Sekunden), der vom Schaltkreisschalter verwendet wird, um seine internen Zählungen zu löschen. Wenn nicht angegeben, wird das Intervall auf denselben Wert festgelegt wie für `timeoutInSeconds`.	`15`
`consecutiveErrors`	Ja	Anzahl der Anforderungen, die auftreten dürfen, bevor der Schaltkreis ausgelöst und geöffnet wird.	`10`
`timeoutInSeconds`	Ja	Zeitdauer (in Sekunden) des offenen Zustands unmittelbar nach dem Ausfall.	`5`

Trennschalterprozess

Durch die Angabe von consecutiveErrors (die Auslösebedingung des Schaltkreises als consecutiveFailures > $(consecutiveErrors)-1) wird die Anzahl der Fehler festgelegt, die auftreten dürfen, bevor der Schaltkreis ausgelöst und zur Hälfte geöffnet wird.

Der Schaltkreis wartet halboffen für die Zeit timeoutInSeconds, in der consecutiveErrors aufeinanderfolgende Anforderungen erfolgreich sein müssen.

Wenn die Anforderungen erfolgreich sind, wird der Schaltkreis geschlossen.
Wenn die Anforderungen fehlschlagen, verbleibt der Schaltkreis in einem halboffenen Zustand.

Wenn Sie keinen intervalInSeconds-Wert eingestellt haben, wird der Schaltkreis nach der Zeit, die Sie für timeoutInSeconds eingestellt haben, in den geschlossenen Zustand zurückgesetzt, unabhängig davon, ob die Anforderung erfolgreich war oder nicht. Wenn Sie intervalInSeconds auf 0 setzen, wird der Schaltkreis nie automatisch zurückgesetzt, sondern wechselt nur dann vom halboffenen in den geschlossenen Zustand, wenn consecutiveErrors Anforderungen hintereinander erfolgreich abgeschlossen werden.

Wenn Sie einen intervalInSeconds-Wert festgelegt haben, bestimmt dieser die Zeitspanne, nach welcher der Schaltkreis wieder in den geschlossenen Zustand versetzt wird, unabhängig davon, ob die im halboffenen Zustand gesendeten Anforderungen erfolgreich waren oder nicht.

Resilienzprotokolle

Wählen Sie im Abschnitt Überwachung Ihrer Container-App die Option Protokolle aus.

Screenshot: Hier finden Sie die Protokolle für Ihre Container-App mit Dapr-Komponentenresilienz.

Schreiben Sie im Protokollbereich eine Abfrage und führen diese aus, um Resilienz über Ihre Container-App-Systemprotokolle zu finden. So können Sie beispielsweise ermitteln, ob eine Resilienzrichtlinie geladen wurde:

ContainerAppConsoleLogs_CL
| where ContainerName_s == "daprd"
| where Log_s contains "Loading Resiliency configuration:"
| project time_t, Category, ContainerAppName_s, Log_s
| order by time_t desc

Klicken Sie auf Ausführen, um die Abfrage auszuführen und das Ergebnis mit der Protokollmeldung anzuzeigen, die angibt, dass die Richtlinie geladen wird.

Sie können auch die tatsächliche Resilienzrichtlinie suchen, indem Sie das Debuggen für Ihre Komponente aktivieren und eine Abfrage ähnlich wie im folgenden Beispiel verwenden:

ContainerAppConsoleLogs_CL
| where ContainerName_s == "daprd"
| where Log_s contains "Resiliency configuration ("
| project time_t, Category, ContainerAppName_s, Log_s
| order by time_t desc

Klicken Sie auf Ausführen, um die Abfrage auszuführen und die resultierende Protokollmeldung mit der Richtlinienkonfiguration anzuzeigen.

Screenshot: Ergebnisse der Resilienzabfrage basierend auf dem bereitgestellten Abfragebeispiel zum Suchen der Resilienzrichtlinie.

Erfahren Sie, wie Resilienz funktioniert für die Dienst-zu-Dienst-Kommunikation mithilfe von Azure Container Apps, die in der Dienstermittlung erstellt wurden

Freigeben über

Dapr-Komponentenresilienz

Unterstützte Resilienzrichtlinien

Konfigurieren von Resilienzrichtlinien

Voraussetzungen

Erstellen bestimmter Richtlinien

Erstellen von Richtlinien mit Resilienz-YAML

Aktualisieren bestimmter Richtlinien

Aktualisieren von Richtlinien mit Resilienz-YAML

Anzeigen von Richtlinien

Löschen von Richtlinien

Richtlinienspezifikationen

Zeitlimits

Retries

Trennschalter

Trennschalterprozess

Resilienzprotokolle

Feedback

Zusätzliche Ressourcen

Freigeben über

Dapr-Komponentenresilienz

Unterstützte Resilienzrichtlinien

Konfigurieren von Resilienzrichtlinien

Richtlinienspezifikationen

Zeitlimits

Retries

Trennschalter

Trennschalterprozess

Resilienzprotokolle

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen