引言:
近期VMware被博通收購轉訂閱的模式的話(huà)題如火如荼。截至本篇文章發(fā)稿之時(shí),戴爾科技集團的Dell VxRail是目前確認在全球市場(chǎng)上仍可以繼續銷(xiāo)售VMware永久授權并提供讓用戶(hù)靈活選擇VMware軟件組合的超融合產(chǎn)品,戴爾科技集團與博通將繼續緊密合作。對于希望繼續以永久授權方式進(jìn)行VMware采購的用戶(hù)來(lái)說(shuō),無(wú)異于額外的驚喜。除了vSphere/vSAN,還可以選配Aria和VCF等產(chǎn)品。
2023年的最后兩個(gè)月,中國的互聯(lián)網(wǎng)行業(yè)迎來(lái)了一波系統崩潰潮,公有云越來(lái)越貴的賬單已經(jīng)飽受用戶(hù)詬病,而現在云廠(chǎng)商所極力宣揚的N個(gè)9的可靠性又給了用戶(hù)當頭一棒,因此很多企業(yè)開(kāi)始考慮將“下云”提上日程。相比公有云來(lái)說(shuō),企業(yè)自建數據中心建設成本更可控,數據隱私更有保障,但是如何保證數據中心的可靠性以及業(yè)務(wù)連續性,卻給企業(yè)IT管理者提出了挑戰。
以VMware vSphere為代表的虛擬化技術(shù)已經(jīng)成為現代化數據中心建設的“黃金標準”,幾乎是不可缺少的一部分。虛擬化技術(shù)的廣泛應用,不僅提高了IT資源的利用率,加快了系統部署的速度,降低了運維復雜度,更重要的是借助虛擬化自身的HA、FT、DRS等功能提升了業(yè)務(wù)連續性,避免了由于設備故障導致業(yè)務(wù)長(cháng)時(shí)間停機。
但是目前大部分企業(yè)在IT基礎架構的高可用設計方面,還局限在單個(gè)數據中心內部,一旦數據中心整體發(fā)生故障,就會(huì )導致業(yè)務(wù)長(cháng)時(shí)間停機,甚至造成數據丟失。
那么如何實(shí)現類(lèi)似公有云的站點(diǎn)故障切換能力,確保當一個(gè)數據中心故障時(shí)業(yè)務(wù)系統可以切換到另一個(gè)數據中心呢,借助虛擬化的雙活或者容災解決方案可以幫助企業(yè)簡(jiǎn)單高效的實(shí)現這一目標。
什么是數據中心雙活?
雙活是兩個(gè)或者多個(gè)數據中心,每個(gè)數據中心都具有獨立運行應用系統所需要的所有資源。正常情況下,應用在兩個(gè)數據中心負載均衡,而當一個(gè)數據中心故障時(shí),另一個(gè)數據中心會(huì )承接所有的應用負載。雙活數據中心解決方案具備以下特征:
• 自動(dòng)的故障切換流程;
• 雙站點(diǎn)負載均衡的同時(shí),可以實(shí)現一個(gè)站點(diǎn)完全失效方面的保護;
• 兩個(gè)數據中心的距離較短(通常100KM以?xún)?,同時(shí)需要大帶寬、低延遲的網(wǎng)絡(luò )互聯(lián);
• RPO為零的同時(shí),大幅縮短RTO。
什么是數據中心容災?
容災數據中心是對生產(chǎn)數據中心的備用保護,在生產(chǎn)數據中心未發(fā)生故障時(shí)不運行任何應用,只有當生產(chǎn)數據中心故障時(shí)才將應用切換到容災數據中心運行,因此數據中心容災解決方案具備以下特征:
• 半自動(dòng)或者手動(dòng)的故障切換流程;
• 容災數據中心的資源處于“冷備”狀態(tài),只有生產(chǎn)數據中心失效才運行使用;
• 容災數據中心和生產(chǎn)數據中心的距離可以較遠,對于網(wǎng)絡(luò )的要求不高;
• RPO通常為分鐘或者小時(shí)級,RTO較高;
• 容災數據中心的資源配置優(yōu)先保證應用可以運行,但不一定能保證運行的性能。
雙活和容災都是企業(yè)提升數據中心業(yè)務(wù)連續性的有效手段,而對于一些關(guān)鍵型工作負載,雙活的需求往往是迫切的。如果業(yè)務(wù)系統自身不支持應用層的負載均衡(如Oracle RAC是典型的應用層負載均衡),那么必須依賴(lài)基礎架構的雙活來(lái)實(shí)現。
為了保證RPO=0,在VMware雙活數據中心建設方案中設計的重點(diǎn)和難點(diǎn)是存儲雙活的設計,在傳統三層虛擬化架構(服務(wù)器+SAN交換機+集中式存儲)中主要依賴(lài)于存儲產(chǎn)品自身的雙活功能或者專(zhuān)用存儲網(wǎng)關(guān)來(lái)實(shí)現雙活,如下是典型的基于VPLEX的VMware雙活數據中心架構圖:
這種架構過(guò)去在金融、制造以及醫療行業(yè)應用較多,架構成熟,但是建設成本較高,架構和運維也比較復雜。最近幾年隨著(zhù)超融合技術(shù)在數據中心的廣泛應用,超融合不僅具備橫向擴展、快速部署、極簡(jiǎn)運維等優(yōu)勢,也讓虛擬化雙活數據中心的建設成本更低、同時(shí)更易落地和運維。其中以VMware vSAN超融合解決方案最具代表性。
VMware保持了全球HCI(超融合基礎設施)軟件市場(chǎng)的主導地位,vSAN跟vSphere ESXi內核集成,而無(wú)需部署專(zhuān)用的虛擬機作為存儲控制器,給用戶(hù)帶來(lái)了更好的產(chǎn)品體驗和存儲性能。vSAN的產(chǎn)品優(yōu)勢不是本文的探討重點(diǎn),感興趣的讀者可以去深入了解vSAN底層技術(shù)原理。
VxRail與vSAN的關(guān)系?
VxRail是Dell和VMware聯(lián)合研發(fā)的基于vSAN的超融合一體機,用于增強VMware的產(chǎn)品力,提升VMware的使用體驗。根據2023年IDC全球第三季度數據顯示,Dell在超融合市場(chǎng)份額占35.5%,居第一。過(guò)半數的vSAN用戶(hù)都選擇VxRail,因為它極大降低了環(huán)境部署和維護的工作量,并且加持了RP4VM的數據實(shí)時(shí)保護,以超越vSAN DIY的用戶(hù)體驗,提供更好穩定性和安全性。
VxRail完成了集成、預先配置和預先測試,保證了產(chǎn)品的可靠性和穩定性,避免軟件和硬件之間的兼容性問(wèn)題。VxRail Manger生命周期管理軟件提供了自動(dòng)化部署、一鍵式升級等功能。Dell投入了大量的研發(fā)力量打造了VxRail產(chǎn)品,目前VxRail研發(fā)中心有三百多個(gè)研發(fā)人員,其中測試工程師有一百多人,對每一個(gè)發(fā)行的VxRail版本會(huì )經(jīng)過(guò)長(cháng)達上百萬(wàn)個(gè)小時(shí)的測試驗證。
當企業(yè)希望通過(guò)vSAN超融合架構承載核心工作負載時(shí),VxRail將是最好的選擇,能夠更好的保證業(yè)務(wù)的穩定運行。
vSAN作為虛擬化架構中的“存儲層”,它自身的雙活功能(vSAN Stretched Cluster)極大的簡(jiǎn)化了用戶(hù)構建VMware雙活數據中心的復雜度,并大幅降低了部署成本。
延伸集群是 vSAN 特有的概念,它是把一個(gè)普通的單站點(diǎn) (site) 集群延伸 (Stretch) 到了另一個(gè)站點(diǎn),形成一個(gè)橫跨兩個(gè)站點(diǎn)的集群,稱(chēng)之為延伸集群 (Stretched Cluster)。延伸集群具有普通集群所有的 HA 保護功能,能夠跨站點(diǎn)地保存數據副本,并且位于兩個(gè)站點(diǎn)內的服務(wù)器都可以是活動(dòng)的,從而以較低的成本實(shí)現了雙活數據中心。
延伸集群通常部署在數據中心之間距離有限的環(huán)境中,例如城域或園區環(huán)境。使用延伸群集可以管理計劃內維護并避免災難情況,因為維護或丟失一個(gè)站點(diǎn)不會(huì )影響群集的整體運行。在延伸群集配置中,兩個(gè)數據站點(diǎn)都是活動(dòng)站點(diǎn)。如果任一站點(diǎn)發(fā)生故障,vSAN 將使用另一個(gè)站點(diǎn)上的存儲。
我們常說(shuō)的“兩地三中心”的概念指的就是IT基礎架構同時(shí)具備同城雙活和異地容災的能力。“兩地三中心”是很多IT管理者的終極目標,而現在借助于VxRail就可以輕松實(shí)現這一愿景,目前在中國很多制造、醫療、金融客戶(hù)已經(jīng)通過(guò)Dell VxRail實(shí)現了“兩地三中心”的架構,并且所有的售后服務(wù)全部由Dell提供保駕護航。
最后,在引言中提及的VMware授權方式及產(chǎn)品組合大幅調整的事件,雖在情理之中,又在意料之外。我們了解到,很多客戶(hù)對于VMware此次調整都難免有些措手不及。
無(wú)論用戶(hù)是希望繼續采用VMware技術(shù)或是希望尋找替換方案,客戶(hù)都需要更長(cháng)的時(shí)間進(jìn)行財務(wù)分析、方向討論及替代方案的評估等。因為這會(huì )涉及到企業(yè)核心的虛擬化平臺的改變,牽一發(fā)而動(dòng)全身,任何變化對于IT穩定運行及對公司業(yè)務(wù)的支撐都是巨大挑戰。
Dell VxRail除了繼續以原有的模式銷(xiāo)售VMware永久授權(截至本篇文章發(fā)稿之時(shí)的實(shí)時(shí)更新)之外,客戶(hù)基于戴爾完善的服務(wù)體系支撐,獲得了3~5年的窗口期,讓企業(yè)可以從容應對變化,有更充分的時(shí)間做更細致的評估。這對企業(yè)持續而穩定的IT戰略是至關(guān)重要的。