了解最新公司動態及行業資訊
湖北IT公司副總經理奚黎明
運維發展歷程
自從有了電腦系統,就有了系統的運維。對于銀行來說,真正的系統化運維是在銀行實現了一個大的中心化系統之后才開始的。當時,央行先后發布了《銀行集中數據中心規范》(JR/T0011-2004)金融行業標準)、《關于進一步加強銀行業金融機構信息安全的指導意見》(銀發[ 2006]]123)文件等,指出了集中化模式下生產運維管理的方向。并結合自身實際情況,從人員、技術、流程等方面構建運維管理體系。銀行大型集中運維管理系統是銀行業最重要的組成部分。已進入信息化領域。
浦發銀行于2003年11月完成全行大型集中系統建設,并開始組建生產運維管理團隊。一年后,新的集中式數據中心上線,大集中模式下的運維管理體系初具規模。 在運維人員方面,按照系統、網絡、設備、應用等專業工種,分班設崗;運維工具方面,引入專業商業軟件,實現監控感知;在運維流程方面,加強事件管理和問題管理。 、變更管理、配置管理等業務流程的建立和實施。到2010年,浦發銀行將災備中心從同城升級到異地,形成“大異地、小同城”的“兩地三中心”布局,開啟“兩地交替運行” ”改為“兩地雙活”。 ”路。此時,生產運維管理開始跨越上海和合肥。
回顧這段歷史,運維正處于從“手動化”到“腳本化”的過程中,這是一種非常傳統的運維方式,運維的提升之路才剛剛開始。直到“十三五”末期,數字化轉型突然成為主流。相應地,運維向運維開發的轉變、向運維分析的轉變被提上了日程,運維的提升之路從“腳本化”轉向“自動化”和“服務化” ,然后是“智能”。
為什么要轉型運維?
運維轉型的兩大驅動力:一是業務驅動力,二是技術驅動力。
1。運維轉型的業務驅動力
當“銀行不改,我們就改銀行”越來越現實,銀行的傳統業務明顯受到擠壓,各家銀行都意識到業務轉型的必要性。為了改變商業模式,更好地服務“長尾客戶”,需要依靠系統和數據的支持。
2018年浦發銀行發布無界開放銀行,2020年又發布全景銀行(即開放銀行2.0),這些都是業務目標,要超越范圍傳統銀行業務的生態,實現這些業務目標,需要數據和數字技術的驅動,以及系統平臺的支撐,顯然這些支撐平臺系統規模更大,技術類型更復雜,運行速度更快,更頻繁的生產變化。它的運行離不開高效的運維,因此必須轉變運維。
2。運維改造的技術驅動力
(1)分布式。多年來,銀行業多采用高性能大型機構建巨石應用系統,很好地支持了大規模業務處理。然而,隨著“秒殺”的發展活動、服務 由于長尾客戶和服務生態客戶的業務發展需求,中心化架構性價比不高,彈性伸縮能力不足,分布式架構已經被各大互聯網公司實踐驗證。 ,銀行IT系統架構已經從集中式轉向集中式分布式。分布式系統需要服務的多副本和數據冗余,相應地,需要多地多中心(如兩地五中心等)來實現容災恢復和連續性。顯然,運維要面對更多的數據中心,以及大量的計算機ter 設備和分散的應用系統。
(2)云原生。數字經濟將引領未來經濟發展。傳統企業要想跟上時代的發展,就需要實施數字化轉型。然而,對人力的巨大投入,轉型所需的財力和物力制約著傳統企業的轉型,一條可行的路徑是上云,利用SaaS服務以“更多、更快、更好、更省”的方式進行數字化轉型。因此,很多金融機構正在思考搭建平臺、搭建生態,不僅服務實體經濟,同時也在尋找新的金融商機。這與搭建云平臺(IaaS、PaaS)和搭建云服務(SaaS)密不可分。
云原生就是實現+容器化+微服務。簡單來說,流程是敏捷的,容器是技術的組件化,微服務是業務和應用的組件化。組件化的目的是實現標準化和快速組裝。一句話概括,云原生就是在業務、應用、技術、流程等方面達到快速、敏捷的目的。因此,運維不僅要面對大量的計算機設備和分散的應用系統,還要面對系統的快速迭代和頻繁變化。
(3)數字化。數字化中的“數字”是指云、大數據、人工智能等數字技術it運維技術,而“數字化”是指變化,是質的變化。使用數字技術改變社會,就是社會數字化;用數字技術改變銀行,就是銀行數字化;用數字技術改變運維,就是運維數字化。包括 畢竟系統生命周期中的大部分時間都處于運營階段,而系統產生價值的階段也處于運營階段,所以運維的數字化轉型意義重大。
綜上所述,從IT系統架構變革、敏捷運營、數字化發展變革的角度來看,運維轉型的趨勢是必然且勢在必行的。
運維走向何方?
走向數字化是運維轉型的大方向。具體目標包括實現一體化集中運維模式,向運維開發和運維分析轉型。
1。一體化集中運維
兩年前,浦發銀行開始在上海和合肥探索基于“雙活”的一體化集中運維模式,即遠程集中運維與遠程集中運維的有機統一模式。 - 現場本地運維,提前支撐未來“為多地多中心運維做好準備。一方面是在人才密集地區(如長三角),并創建了一個集中的滿足連續性要求的遠程運維團隊,分布在上海和合肥。另一方面,根據“最小化”的目標,本地運維團隊機房的設置,承擔機房基礎環境和硬件設備必須在現場操作和維護的工作,并鋪設為未來在電力資源豐富的地區實施數據中心奠定了基礎。
2。向運維開發轉型
運維管理體系無非就是人員、技術和流程。然而,在數字化時代,運維對象發生了巨大的變化,運維管理體系也需要隨之改變。例如,硬件設備逐漸走向軟件定義,應用更新逐漸走向持續交付,運維對象逐漸走向數字孿生,運維流程逐漸走向在線自助等等。 在這里,運維技術就變得極為重要。它不能再作為單獨的工具存在,而是嵌入到運維工作的方方面面。要求運維人員采用軟件開發的方法來實現運維工作,即運維向運維開發轉變,從而直觀地感知運維對象,自動完成運維操作,并在線為各種服務對象提供自助服務功能。
如圖1所示,運維管理體系包括運維對象、運維流程、核心資產、運維工具、服務對象五個維度。
圖1運維管理系統示意圖
3。向運營分析轉型
傳統運維依賴人和人的經驗(即知識),而數字化運維則應突出數據、算法和模型(即知識)的作用,強調運維向運維的轉變分析 。構建包括流計算在內的運維大數據平臺,實現對各種運維對象和運維流程的實時數據采集,對運維數據進行實時分析處理,是運維的又一工具。和維護人員(見圖 2)。顯示)。
圖2運維大數據處理示意圖
運維分析可以從海量運維數據的“金礦”中挖出“金礦”,實時秒級感知,全景縱橫展示,故障根因定位,容量分析和預測,以及許多其他事情。例如,浦發銀行每月10號開展的權益贖回活動,自主研發并構建了運維大數據流處理引擎。大屏實時采集、分析、聚合、可視化高并發事務消息,以及每個應用系統的系統吞吐率、系統成功率、事務響應時間、業務交易量、業務交易量整個交易環節。各種運行指標實時呈現。這樣可以有效地幫助管理人員、業務人員和技術人員精細化地控制“秒殺”類推廣活動中的業務和系統運行。
如何提高運維?
傳統的運維依賴于手動操作和一些腳本執行。數字化運維改進之路是從腳本化轉向自動化、服務化和智能化(如圖 3 所示)。
圖3 運維數字化提升之路
1。自動化
需要持續交付,那么機房基礎環境和IT基礎軟硬件需要提前部署并快速交付,應用軟件需要CD(持續部署)對接CI(持續集成) ) 實現持續交付,因此應用軟件更新是自動化的。是敏捷的關鍵。近兩年,浦發銀行重新規劃建設運維工具體系,全面提升運維自動化水平。其中,企業級CD平臺已全面完成,90%以上的應用系統更新已通過自動化方式完成。例如,手機銀行系統運行在數千個容器上it運維技術,應用程序更改次數每月實施超過 50 次。沒有自動化,很難通過增加運維人員來實現持續交付。工作量減少了。
2。服務
自動化向上發展是以服務為導向的,即運維工作要細化為服務項目。每個服務項目包括申請審批流程和自動化操作,并提供服務對象以自助方式使用這些服務,實現“自助”,從而進一步將運維人員從繁重的日常工作中“解放”出來(見圖4)。
圖4運維工具系統示意圖
3。智能
運維數字化的高級階段是智能運維(AIOps),它利用運維大數據、機器學習等人工智能技術,走向動態調整監控閾值、故障定位和自愈,以及 IT 資源的動態調度。 ,進而在一定程度上實現人腦的替代。
對此,浦發銀行進行了有益的嘗試。建立十余種智能算法,通過對各種不同結構的日志數據進行實時處理,適應不同性能指標的趨勢規律,無需人工判斷,即可在數據深處發現異常情況,實現預判警告和自動進行中。定位故障點和事后回顧的目的有據可查,減少對運維專家經驗的依賴,縮短應急響應和恢復時間。
大中型銀行的運維轉型面臨諸多挑戰。運維除了適應改造需求的能力外,還受制于系統生命周期中前期流程的能力和水平。但是,無論多么困難,我們都必須堅持數字化是運維轉型和改進的唯一出路。
(專欄編輯:張麗霞)