了解最新公司動態及行業資訊
傳統的 IT 運營無法以現代云原生軟件交付率運行。因此,站點可靠性工程 (SRE) 在整個行業中越來越受歡迎。最初開發的 SRE 與過去的 IT 運營完全不同,因為它專注于 bug 預算、由 bug 預算驅動的團隊間關系、一切即代碼以及 SRE 團隊的能力。
以下是小型企業可以利用 SRE 的方式,以及它對領導者和實踐型經理的 IT 運營的影響。
1.讓軟件工程師設計 ITOps
SRE 團隊的成員要么是擁有豐富運營知識的軟件開發人員,要么是擁有強大軟件開發技能的 IT 運營人員。無論哪種方式,軟件都是 SRE 團隊用來解決問題的技巧。
IT 運營的軟件優先方法有時會延伸到開發團隊的角色。如果負責特定應用程序或服務的 SRE 團隊發現它花費了超過 50% 的時間來自動化解決軟件中的問題,則開發團隊必須填補這一空白。
根據客戶可靠性工程師的說法,這是由以下人員完成的:
當操作負載反彈到 50% 或更低時,所有重定向都將結束。
為此,如果開發團隊生產的軟件在 SRE 團隊的 50% 平衡范圍內無法運行it技能服務,則開發團隊必須承擔運營任務并幫助修補它們,并了解運營方面的需要。在利用 SRE 的技能和保留開發團隊對軟件的運營責任之間,這是一個高度自律的平衡。
2.嚴格關注錯誤預算和 SLO
SRE 方法的核心是 SRE 團隊正在運行的應用程序或服務的 SLO。服務的產品總監必須選擇適當的 SLO,以便在可能的停機期間有足夠的余地來解決不可預見的問題,同時以用戶期望的速度交付功能和更新。
3.將 ITOps 視為價值中心,而不是成本中心
SRE 是一項高技能的活動,SRE 專家供不應求。甚至努力招募 SRE。深厚的技術技能和以客戶為中心的 SLO 和錯誤預算的不同尋常的結合意味著試圖增加 SRE 團隊的成本并不是明智之舉。
為此,采用 SRE 的企業必須停止將 IT 運營視為降低成本的項目。相反it技能服務,他們必須將 IT 運營視為一個價值中心,可以幫助公司避免停機并最大限度地提高收入和服務可用性。
4.讓 SRE 快速啟動云原生 IT 運營
對于開始轉向基于云的平臺和交付模式的企業來說,人工和團隊責任的一系列選項可能令人生畏。各種不同的處理方式可能會令人不安,部分原因是上下文對這些不同選項的有效性有巨大影響。
SRE 模型提供了一套適合小型組織的清晰、具體的實踐和團隊動態。如果您所在的企業需要快速從更傳統的設置遷移到云原生 IT 運營,那么采用 SRE 可能效果很好——盡管只有正確采用它,而不僅僅是重命名現有團隊。
通過采用 SRE,您也許可以避免其他交付模型在組織上的尷尬,但要注意這些笨拙的實現,它們不能完善必要的、有意的職責平衡。
SRE 是一種針對大型云原生軟件系統的 IT 運營的特定方法。 SRE 模型使用 SLO 和錯誤預算在開發團隊和 SRE 團隊之間建立健康高效的交互,以平衡新功能的速度與使軟件可靠所需的所有工作。
因此,SRE 需要特殊技能才能成功,以及團隊之間的強大信任。 5月19-20日,全球運維大會北京站前夕,SRE(Site )課程即將開課!
本課程側重于 SRE 的發展及其未來方向,并為參與者提供實踐、技術和工具,以使整個組織的人員參與可靠性和穩定性,并通過使用真實場景和案例進行案例研究來進行演示。完成課程后,學生將返回公司專注于了解、設置和跟蹤服務水平目標 (SLO) 等內容。
本課程幫助學習者成功完成 SRE 認證考試。
課程受眾
SRE 課程的目標受眾是專業人士
任何對更高可靠性和甜度感興趣的人
任何對 IT 領導力和組織變革的現代方法感興趣的人
SRE 工程師
業務總監
業務利益相關者
顧問
練習
IT 總監
IT 總監
IT 團隊負責人
產品負責人
Scrum 大師
'/>
軟件工程師
系統集成商
工具提供者
_
教學大綱
課程介紹
模塊 1:SRE 原則與實踐
模塊 2:服務水平目標和錯誤預算
模塊 3:減少努力
模塊 4:監控和服務水平指標
模塊 5:SRE 工具和手動化
模塊 6:反脆弱性和從失敗中學習
模塊 7:SRE 的組織影響
模塊 8:SRE,其他框架
課程目標
SRE 課程的學習目標包括實踐和理解:
SRE課程詳細課程咨詢: