
隨著互聯(lián)網(wǎng)金融的到來,數(shù)字化、智能化技術與開放銀行成為銀行新興的增長極。人民銀行《金融科技(FinTech)發(fā)展規(guī)劃(2019-2021年)》為我們指明了一條必由之路:分布式與云計算。以開源為特征的“分”“云”技術體系,有利于我國銀行業(yè)適應國家信息技術應用創(chuàng)新的戰(zhàn)略要求。
交行分布式云計算建設之路
根據(jù)“十三五”規(guī)劃要求,2017年交行開始實施分布式云計算建設,基于虛擬化技術建立私有云,實現(xiàn)了資源池的一鍵式資源部署、規(guī)范交付資源。數(shù)據(jù)中心交付能力得到了大幅度提升,資源交付由原來以天為單位轉變?yōu)榉昼娂墶D壳吧a(chǎn)云平臺已納管10個資源池,存量納管分區(qū)數(shù)量達2000余臺。
交行云平臺建設取得了豐碩成果。首先,實現(xiàn)基于應用視圖的跨云多分區(qū)自動化部署,并通過資源分配和參數(shù)配置的標準化,形成資源分配模型,實現(xiàn)端到端自動化交付。其次,實現(xiàn)高度自動化的資源全生命周期管理,對資源進行自動化上下線等操作,提升運維效率。最后,對接外部管理平臺,完成流程化改造。
2018年,交行啟動了“新531工程”建設,通過雙核異構將主機負載下移,實現(xiàn)了分布式數(shù)據(jù)庫在重要業(yè)務系統(tǒng)中的逐步應用。截至目前,已有雙核異構、網(wǎng)聯(lián)支付清算、貸記卡代授權等13套關鍵系統(tǒng)使用了分布式數(shù)據(jù)庫承載重要業(yè)務交易,當前運行效果良好。
新架構下運維管理轉型展望
在初步建成的云平臺主體框架下,交行數(shù)據(jù)中心積極探索新平臺架構下的運維手段,從理念、團隊、管理、平臺四方面入手,打造具有交行特色的運維體系。
- 運維之道——理念蛻變。傳統(tǒng)數(shù)據(jù)中心的運維目標是“效率、安全、成本”。在新架構環(huán)境下,需要轉變?yōu)?ldquo;智能、開放、演化”的生態(tài)環(huán)。這種轉變一方面來自于本身技術架構采用了越來越多的開源產(chǎn)品;另一方面也需要管理者轉換價值導向,不再拘泥于安全穩(wěn)定,而是通過利用云計算、大數(shù)據(jù)、可視化等技術強化感知和決策能力,達到精細化、動態(tài)化管理的目標。
- 運維之法——團隊轉型。分布式云計算架構環(huán)境中,資源調度、業(yè)務伸縮、故障隔離和故障修復等都是自動化的,未來數(shù)據(jù)中心的核心運維工作將是構建自動化運維模型和工具。運維人員需要全面熟悉基礎資源、網(wǎng)絡、云架構、運維工具和應用特點,逐漸把重點從“運維管理”轉變成“運維研發(fā)”,建立高效智能的自動化運維平臺。
- 運維之術——管理優(yōu)化。圍繞建設國內(nèi)一流數(shù)據(jù)中心的目標,交行不斷優(yōu)化服務管理體系,形成了特有的“六化”管理方針。管理流程化、體系化、一體化:在ITIL V3和ISO 20000的基礎上,面對分布式云架構轉型,積極探索流程管理平臺智慧化轉型。技術標準化:目前共制定軟硬件版本標準26項,參數(shù)配置標準94項、網(wǎng)絡基線標準612項、安全基線標準206項,且制定了分布式云架構的資源池模型、參數(shù)配置和管理標準。技術自動化:目前自動化場景包括健康檢查、安裝配置、安全加固、災備切換等多個方面。生產(chǎn)分區(qū)自動化覆蓋率97.89%,變更自動化率37%,自動化作業(yè)覆蓋32項大類的1700項作業(yè)流。技術智能化:集中推進智能運維(AIOPS)項目建設,對監(jiān)控信息、日志、CMDB等運維大數(shù)據(jù)進行深度分析和有效處理,使生產(chǎn)運維從自動化、標準化進一步走向智能化。
- 運維之器——平臺支撐。面對分布式與云計算新一代體系架構,運維中臺作為運維策略和管理流程的落腳點,需要以數(shù)據(jù)匯集與標準化治理為基礎,以自動化服務、數(shù)據(jù)服務、算法服務為支撐,以千人千面、自主化場景設計為核心,與運維流程進行一體化融合,通過標準化數(shù)據(jù)接口、算法集市、自主化場景構建等將生產(chǎn)運維相關的各個平臺打通并融為一個運維整體,打造數(shù)據(jù)中心智能運維體系,實現(xiàn)運維操作自動化。
我們相信,分布式云計算將是未來數(shù)據(jù)中心的主流架構,智能運維是未來數(shù)據(jù)中心發(fā)展的必經(jīng)階段,從規(guī)范化走向智能化,從高效運維邁向智慧運“贏”是數(shù)據(jù)中心的宏偉藍圖。