Description
SRE實踐與開發平台指南:從團隊協作、原則、架構和趨勢掌握全局,做出精準決策
【本書精采維運論點】
✪SRE會包山包海的「稀缺資源」,卻只能獲得香蕉嗎?
要會架構設計、部署應用程式、監控系統建置、值班、On-Call,很稀缺但薪資水準卻讓人覺得不如歸去嗎?
✪星期五不應該部署嗎?
這是業界不成文的共識,為了減少部署事故,因而週末加班,出發點是風險管理,但也有人認為應該可以在任何時間部署,兩派誰是誰非?棋該怎麼下?
✪維運團隊該用Scurm、Kanban、Waterfall嗎?
現代軟體開發有很多框架,SRE一半的時間在開發、一半在維運,應該用哪個方法?
✪大樓理論
SRE處理現場問題,須精準掌握系統架構,而描述架構的方法從生活中就可以找到。軟體架構的概念源自於建築業,直接類比於建築是最直覺的。
✪平台工程標準化
應用程式都有兩種層次介面,一是給使用者的公開介面,如Web API、標準函式庫;另一種是團隊看到的內部介面,如Config、CLI,只有標準化才能產生效率。
目錄Part 01 真實世界的普遍問題
|Chapter 01| 維運團隊的普遍現象
1.1 現象:招募傳統維運工程師做SRE的工作
1.2 現象:自動化其實是個錯覺?
1.3 現象:維運需求與價值的選擇
1.4 現象:SRE會包山包海,卻只能獲得香蕉?
1.5 現象:星期五不應該部署?
1.6 本章回顧
|Chapter 02| 維運時間殺!SRE需要制度!
2.1 制度:為何而戰,談需求與價值
2.2 制度:讓維運團隊自主運作的制度框架
2.3 制度:維運團隊該用Scurm、Kanban、Waterfall?
2.4 制度:值班還是待命?
2.5 本章回顧
|Chapter 03| 團隊的介面,合作共創
3.1 溝通介面:時間在哪,成就就在哪
3.2 介面:Go Live
3.3 介面:SRE需要負責部署?
3.4 介面:版本管理
3.5 本章回顧
|Chapter 04| 事件管理
4.1 讓組織對異常事件有一致性的理解
4.2 計畫中的事件
4.3 非預期事件與異常處理方法
4.4 從失敗中學習:訓練與事件報告
4.5 本章回顧
Part 02 開發維運治理
|Chapter 05| 系統架構之大樓理論
5.1 大樓理論
5.2 描述架構的具體方法
5.3 本章回顧
|Chapter 06| 服務治理
6.1 服務目錄
6.2 定義與實例
6.3 服務類型
6.4 服務範圍
6.5 本章回顧
|Chapter 07| 軟體交付的四大支柱
7.1 產出物:軟體交付的基礎單位
7.2 環境建置
7.3 應用程式配置:軟體的內部介面與依賴反轉
7.4 交付流水線
7.5 本章回顧
|Chapter 08| 觀測與監控
8.1 觀測、監視與控制
8.2 設計指標
8.3 服務健康
8.4 本章回顧
Part 03 開發平台與平台工程
|Chapter 09| 開發平台:設計概念與整體藍圖
9.1 以終為始
9.2 使用者介面
9.3 系統架構
9.4 本章回顧
|Chapter 10| 平台工程:服務標準化
10.1 應用程式標準化:生命週期
10.2 由外往內的標準化
10.3 開發樣板
10.4 本章回顧
书名简译:SRE实践与开发平台指南:从团队协作、原则、架构和趋势掌握全局,做出精准决策
目前沒有評價。