網站可靠性工程 (SRE) 書籍

了解或強化 SRE 知識的最佳方式之一是閱讀相關資訊。 以下是我們在主題上看到的一些最佳撰寫資訊來源。

核心 SRE 書籍

如需網站可靠性工程 (SRE) 的詳細資訊,最好的來源是關於這個主題的這三本出版書籍

這幾本書各自提供一些重要資訊:

  • The SRE Book:提供 Google 過去幾年來如何實作 SRE 的詳細說明。

  • The SRE Workbook:The SRE Book 的使用手冊,不只有 SRE 在 Google 在其他幾個地方的「性質」,而提供了「方式」和「原因」的詳細說明。

  • Seeking SRE:從 SRE 的源頭出發,提供更廣泛的 SRE 視野,包括先前如何在其他環境中實作的資訊。

由於這些書籍描述組織的體驗、環境和文化可能或可能與您的組織不同,請務必以批判的眼光來閱讀這些書籍。 閱讀時,請嘗試判斷哪些做法在組織中會或不會成功。 請用一些時間找出您確定可以提供正向價值的資訊。 思考一下您的組織文化和價值有哪些部份可以像描述的一樣推動 SRE 工作,又有哪些可能會增加其難度。 仔細且反覆地採用 SRE,幾乎一律會產生比您在這些書籍中所閱讀內容完全重複更好的結果。

其他 SRE 書籍

閱讀上述書籍之後,如果您想要深入了解服務等級指標 (SLA)/服務等級目標 (SLO),以下是絕佳的資源:

實作服務層級目標

如果您想要探索安全性和可靠性工程的交集,本書籍提供該主題的各種良好觀察:

建置安全且可靠的系統