了解最新公司動態及行業資訊
一個擁有4萬臺服務器的公司,整個運維團隊至少有50人
如果是自建IDC,50人中有10人會專門做機房、網絡、服務器、存儲等底層架構,也就是IaaS層
如果你使用公共云服務,你可以拯救這 10 個人
物理架構的 IaaS 層有 PaaS服務器運維技術,這 50 人中可能有 10 人專門從事自動化平臺、發布、監控、DB 管理、容器化、虛擬化等。
上到業務層負責業務運維。可能每2、3個人負責一個比較大的垂直業務,比如微信支付、淘寶訂單管理等。
那么在這2、 3個業務操作中,我通常在簡歷中這樣描述自己
xxx業務核心運維負責人,最高并發QPS xx萬,獨立維護4萬多臺機器服務器運維技術,年可用率99%以上
那么問題來了:“這里所謂的人真的是人嗎?”
借用騰訊藍鯨的架構圖說一下這個問題
從下到上,它們是 IaaS、PaaS 和 SaaS 層。一般來說,大公司的每次運維只負責其中的一小部分。有的專門做虛擬化和容器化,有的專門做監控告警,有的專門做后續業務運維業務生命周期服務
負責采購、上架、調試、拉光纖和網線的這群人,這里不算。
就像蓋一座摩天大樓,大家只看到臺前的建筑師,卻看不到臺后的施工主管
在《SRE》一書中,每個IDC都需要有專門的團隊負責硬件設施和基礎設施
像谷歌這樣強大,擁有百萬級的服務器規模,以及大量的技術專家,也需要有人做一些體力活。
現在有各種公有云,導致很多技術人員做業務應用(包括開發、運維),不需要自己做一些硬件設備相關的工作,但那是站出來的結果巨人的肩膀。太浮了
我的專業經驗有限,沒有親自接觸過幾萬臺規模的項目,但也接觸過上千臺的熱門游戲項目。
當時我是游戲業務的運維,服務器不需要我安裝和配置linux系統。專門的IDC運維團隊拿到服務器root權限后,我負責業務應用的部署和維護,同時也利用其他同事進行開發。各種CMDB、監控、發布系統等
但是,我有自知之明,不敢聲稱獨立維護數千臺服務器的大規模集群