Grundlegendes zu Cache-Verwendungsmodellen

Mit Cache-Verwendungsmodellen können Sie anpassen, wie Ihr Azure HPC Cache Dateien speichert, um Ihren Workflow zu beschleunigen.

Grundlegende Konzepte zum Zwischenspeichern von Dateien

Durch das Zwischenspeichern von Dateien werden Clientanforderungen von Azure HPC Cache beschleunigt. Dabei werden die folgenden grundlegenden Methoden verwendet:

  • Zwischenspeichern von Lesevorgängen: Azure HPC Cache speichert eine Kopie von Dateien, die Clients vom Speichersystem anfordern. Wenn ein Client das nächste Mal dieselbe Datei anfordert, kann HPC Cache die Version im Cache bereitstellen, statt die Datei erneut aus dem Back-End-Speichersystem abrufen zu müssen. Schreibanforderungen werden an das Back-End-Speichersystem übergeben.

  • Zwischenspeichern von Schreibvorgängen: Optional kann Azure HPC Cache eine Kopie der von den Clientcomputern gesendeten geänderten Dateien speichern. Wenn mehrere Clients in einem kurzen Zeitraum Änderungen an derselben Datei vornehmen, können alle Änderungen im Cache erfasst werden, sodass nicht jede Änderung einzeln in das Back-End-Speichersystem geschrieben werden muss. Nach einer festgelegten Zeitspanne ohne Änderungen verschiebt der Cache die Datei in das langfristige Speichersystem.

  • Überprüfungstimer: Die Einstellung für den Überprüfungstimer bestimmt, wie häufig der Cache seine lokale Kopie einer Datei mit der Remoteversion auf dem Back-End-Speichersystem vergleicht. Wenn die Back-End-Kopie aktueller als die zwischengespeicherte Kopie ist, ruft der Cache die Remotekopie ab und speichert sie für zukünftige Anforderungen.

    Die Einstellung des Überprüfungstimers gibt an, wann der Cache Dateien automatisch mit Quelldateien im Remotespeicher vergleicht. Sie können jedoch erzwingen, dass Azure HPC Cache Dateien vergleicht, indem Sie einen Verzeichnisvorgang ausführen, der eine readdirplus-Anforderung enthält. Readdirplus ist eine standardmäßige NFS-API (erweiterter Lesevorgang), die Verzeichnismetadaten zurückgibt. Durch diesen Vorgang wird erzwungen, dass der Cache Dateien vergleicht und aktualisiert.

  • Schreibschutztimer: Für einen Cache mit Lese-/Schreib-Zwischenspeicherung ist der Schreibschutztimer die maximale Zeit in Sekunden, die der Cache wartet, bevor eine geänderte Datei in das Back-End-Speichersystem kopiert wird.

Die in Azure HPC Cache integrierten Verwendungsmodelle haben unterschiedliche Werte für diese Einstellungen, sodass Sie die optimale Kombination für Ihre Situation auswählen können.

Auswahl des richtigen Verwendungsmodells für Ihren Workflow

Sie müssen für jedes von Ihnen verwendete NFS-Protokollspeicherziel ein Nutzungsmodell auswählen. Azure Blob Storage-Ziele verfügen über ein integriertes Verwendungsmodell, das nicht angepasst werden kann.

Mit den HPC Cache-Nutzungsmodellen können Sie zwischen kurzen Reaktionszeiten und dem Risiko veralteter Daten abwägen. Wenn Sie die Geschwindigkeit von Dateilesevorgängen optimieren möchten, spielt es für Sie möglicherweise keine Rolle, ob die Dateien im Cache mit den Back-End-Dateien abgeglichen werden. Wenn Sie andererseits sicherstellen möchten, dass Ihre Dateien immer auf dem neuesten Stand sind, wählen Sie ein Modell aus, und legen Sie den Überprüfungstimer auf eine niedrige Zahl fest, um häufig zu überprüfen.

Die Optionen für das Verwendungsmodell sind:

  • Schreibgeschütztes Zwischenspeichern: Verwenden Sie diese Option, wenn Sie den Lesezugriff auf Dateien beschleunigen möchten. Wählen Sie diese Option aus, wenn Ihr Workflow minimale Schreibvorgänge wie 0 % bis 5 % umfasst.

    Mit dieser Option werden Clientlesevorgänge zwischengespeichert, jedoch keine Schreibvorgänge. Schreibvorgänge werden an den Back-End-Speicher übergeben.

    Im Cache gespeicherte Dateien werden nicht automatisch mit den Dateien auf dem NFS-Speichervolume verglichen. (Lesen Sie die obige Beschreibung der Überprüfungstimer, um zu erfahren, wie Sie diese manuell vergleichen.)

    Wenn Sie die Option Schreibgeschütztes Zwischenspeichern auswählen, können Sie den Überprüfungstimer ändern. Der Standardwert ist 30 Sekunden. Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und einschließlich 31536000 Sekunden (1 Jahr) sein.

  • Zwischenspeicherung mit Lese-/Schreibzugriff: Mit dieser Option werden Lese- und Schreibvorgänge zwischengespeichert. Bei Verwendung dieser Option wird erwartet, dass die meisten Clients über den Azure HPC Cache auf Dateien zugreifen, anstatt den Back-End-Speicher direkt zu installieren. Die zwischengespeicherten Dateien enthalten aktuelle Änderungen, die noch nicht in das Back-End kopiert wurden.

    Bei diesem Nutzungsmodell werden Dateien im Cache standardmäßig nur alle acht Stunden mit den Dateien im Back-End-Speicher verglichen. Es wird davon ausgegangen, dass die zwischengespeicherte Version der Datei aktueller ist. Eine geänderte Datei im Cache wird in das Back-End-Speichersystem geschrieben, nachdem sie standardmäßig eine Stunde lang im Cache gespeichert wurde.

    Wenn Sie die Option Zwischenspeicherung mit Lese-/Schreibzugriff auswählen, können Sie sowohl den Überprüfungstimer als auch den Schreibschutztimer ändern. Der Standardwert für den Überprüfungszeitgeber beträgt 28.800 Sekunden (8 Stunden). Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und einschließlich 31536000 sein. Der Standardwert für den Schreibschutztimer beträgt 3600 Sekunden (1 Stunde). Der Wert muss eine ganze Zahl (keine Dezimalstellen) zwischen 1 und einschließlich 31536000 Sekunden (1 Jahr) sein.

In dieser Tabelle werden die Unterschiede im Nutzungsmodell zusammengefasst:

Nutzungsmodell Cachemodus Überprüfungstimer Schreibschutztimer
Schreibgeschütztes Zwischenspeichern Lesen 30 Sekunden Keine
Zwischenspeichern von Lese- und Schreibvorgängen Lesen/Schreiben 8 Stunden 1 Stunde

Warnung

Durch das Ändern von Nutzungsmodellen wird eine Dienstunterbrechung verursacht. HPC-Cacheclients erhalten keine Antworten, während das Verwendungsmodell umgestellt wird. Wenn Sie Nutzungsmodelle ändern müssen, wird empfohlen, dass die Änderung während eines geplanten Wartungsfensters vorgenommen wird, um Clientunterbrechungen zu verhindern.

Wenn Sie Fragen zum optimalen Verwendungsmodell für Ihren Azure HPC Cache-Workflow haben, wenden Sie sich an Ihren Azure-Vertreter, oder öffnen Sie eine Supportanfrage, um Hilfe zu erhalten.

Tipp

Ein Hilfsprogramm ist verfügbar, um bestimmte einzelne Dateien zurück in ein Speicherziel zu schreiben, ohne den gesamten Cacheinhalt schreiben zu müssen. Weitere Informationen über das flush_file.py-Skript finden Sie unter Anpassen des Dateirückschreibens in Azure HPC Cache.

Nächste Schritte