“青云從2013年開(kāi)始開(kāi)放公有云服務(wù),現在我們迎來(lái)了第三波較大的市場(chǎng)機會(huì ),那就是AI。”青云科技總裁林源在近日舉行的“青云科技AI算力發(fā)布會(huì )”上表示,針對未來(lái)AI應用大爆發(fā)的時(shí)代,青云希望通過(guò)其即將推出的“AI算力調度平臺”和“AI算力云服務(wù)”,抓住和把握這一“比過(guò)去10年更大的市場(chǎng)需求和機會(huì )”。

云服務(wù)變遷與算力需求爆發(fā)
林源談到,在青云科技成立的11年時(shí)間里,一共經(jīng)歷了三次較大的市場(chǎng)機會(huì ):第一波是數字化的機會(huì );第二波是信創(chuàng )國產(chǎn)化替代的機會(huì );第三波則是AI市場(chǎng)機會(huì ),而且AI將會(huì )帶來(lái)一波長(cháng)達10年以上的巨大市場(chǎng)需求和機會(huì )。未來(lái)整個(gè)AIGC投入占企業(yè)IT投入的占比,無(wú)疑會(huì )越來(lái)越高,由此對于底層算力的要求也會(huì )越來(lái)越高。
中國工程院院士鄭緯民曾預計,到2025年,我國AI算力總量將超過(guò)1800EFlops,AI算力占總算力比重超過(guò)85%。可以說(shuō),算力已經(jīng)進(jìn)入到了智算時(shí)代。
“過(guò)去十年是以CPU為主驅動(dòng)的應用革新時(shí)代,如今,GPU的采購量已經(jīng)超過(guò)CPU。未來(lái)則是一個(gè)以GPU為核心的時(shí)代。”林源指出,青云科技在這樣一個(gè)時(shí)期要支撐的將以云原生和AI的應用為主,也包括傳統應用。因為數字化轉型是一個(gè)漫長(cháng)的過(guò)程,青云在未來(lái)10年支撐的應用會(huì )變得更加復雜,應用對于底層算力的要求既有CPU也有GPU。同時(shí),客戶(hù)既有成本敏感的業(yè)務(wù),也有延遲敏感的業(yè)務(wù),業(yè)態(tài)會(huì )更加豐富,對于技術(shù)和對于平臺的挑戰也越來(lái)越多。
面對新的市場(chǎng)需求,青云科技深入理解云對算力賦予的新價(jià)值——打破大規模通用算力、HPC算力、GPU算力的邊界,延伸算力從中心到邊緣與端側的分布,明確了算力資源的統一調度、統一管理、統一運營(yíng),將發(fā)揮至關(guān)重要的作用。“AI算力調度平臺”則是這家公司對此給出的答案。
AI算力調度平臺能力已得到驗證
眾所周知,智算中心投資巨大,能否盈利取決于運營(yíng)效率與平臺能力。而相比于投資與建設,運營(yíng)智算中心更加專(zhuān)業(yè)和復雜。同時(shí),由于數據的隱私性和屬地性,智算中心建設分散,運營(yíng)能力參差不齊。而支持業(yè)務(wù)的多樣性,決定了智算中心要面對極其復雜和現實(shí)的技術(shù)問(wèn)題。
結合青云的自身實(shí)踐,青云科技產(chǎn)品經(jīng)理苗慧將智算中心所面臨的難點(diǎn)總結為五個(gè)方面,多元資源統一調度管理、高速網(wǎng)絡(luò )瓶頸、環(huán)境搭建復雜、多業(yè)務(wù)整合瓶頸、缺乏運營(yíng)服務(wù)。
面對AI基礎設施的管理和運營(yíng),青云給出的答案是“AI算力調度平臺”。在青云的產(chǎn)品定義里,AI算力調度平臺是智算中心運營(yíng)者的關(guān)鍵工具,可以幫其建立從建設運營(yíng)的閉環(huán)。
實(shí)際上,這并非青云提出的一個(gè)純“概念性”的東西,而是已經(jīng)在國家超算濟南中心取得成功實(shí)踐的產(chǎn)品。三年前,青云開(kāi)始服務(wù)國家超算濟南中心,這是一個(gè)多元計算中心,同時(shí)也是一個(gè)異構算力中心,其中包括HPC超算、傳統云計算(以CPU為主)、智算(以GPU為主),而且還存在國產(chǎn)化GPU產(chǎn)品的兼容。在這個(gè)建設方案里,幾乎所有產(chǎn)業(yè)鏈上的廠(chǎng)商都在,但整個(gè)算力調度平臺是由青云獨家供應的。如今,國家超算濟南中心已經(jīng)成功運營(yíng)并實(shí)現盈利。
在苗慧看來(lái),國家超算濟南中心成功實(shí)踐的背后,是因為青云“AI算力調度平臺”具備多區域業(yè)務(wù)資源整合、分布式調度與管理、AI訓練平臺、算法開(kāi)發(fā)支持、靈活調度、混合組網(wǎng)、模型倉庫(MaaS)、高速并行存儲、容量推理服務(wù)平臺等九大關(guān)鍵能力,可以做到“像管理本地資源一樣管理AI基礎設施”;同時(shí),在芯片國產(chǎn)替代、智簡(jiǎn)運營(yíng)運維和生態(tài)構建方面,青云也在持續迭代,具備了完整的平臺能力。“青云經(jīng)過(guò)公有云積累的大量產(chǎn)品實(shí)踐和運維運營(yíng)經(jīng)驗,形成了成熟的產(chǎn)品力,才會(huì )跟合作伙伴合作,讓他們使用。”
以生態(tài)同盟方式聯(lián)營(yíng)AI算力云
除了AI算力調度平臺外,青云還提出了“AI算力云服務(wù)”。林源解釋說(shuō),這是一個(gè)以青云為主、對外運營(yíng)的AI算力的服務(wù),并且青云會(huì )以生態(tài)的方式一起聯(lián)營(yíng)AI算力云。“傳統云服務(wù)的10年,很多服務(wù)商喜歡大包大攬,從底層的IDC-硬件-軟件-PaaS都自建、自投、自營(yíng),這是傳統模式。而現實(shí)有兩點(diǎn)挑戰:一是自己干得越多,研發(fā)費用越高,成本越重。二是在A(yíng)I時(shí)代,做好每一層的成本都比過(guò)去10年更高。”
“我們有一個(gè)大膽的設想,在A(yíng)I領(lǐng)域一定會(huì )出現巨頭,但這個(gè)巨頭不應該是一家獨立的公司,它應該是一個(gè)小的生態(tài),因為要做的事情真的太多了。因此,青云AI算力云服務(wù)的定位是一個(gè)開(kāi)放的生態(tài)同盟。青云集結這些志同道合的合作伙伴,通過(guò)同盟的方式一起運營(yíng)AI算力云服務(wù)。”他強調,在A(yíng)I算力云當中,“首先,客戶(hù)需要完整的解決方案,所以生態(tài)是必須的。第二,每位參與者都是專(zhuān)業(yè)的、彼此需要的,所以彼此之間應該要開(kāi)放。第三,大家是志同道合、長(cháng)期共贏(yíng)的同盟。”
在他看來(lái),在上一個(gè)時(shí)代,青云做這個(gè)事情可能并不容易。但是現在的時(shí)代經(jīng)濟背景之下,以及每個(gè)層次都要投入巨大且專(zhuān)業(yè)的現狀之下,大家都有彼此合作的需求。每一個(gè)新時(shí)代到來(lái)的時(shí)候,大家都在同一起跑線(xiàn),而且新的時(shí)代可能需要一些新的合作模式和新的玩法。
“青云希望通過(guò)一個(gè)開(kāi)放的、成熟的、可運營(yíng)的AI算力調度平臺,通過(guò)自營(yíng)、合營(yíng)乃至支撐第三方運營(yíng)的方式,與生態(tài)同盟一起貢獻我們的AI Cloud。青云不是什么都做,只做自己最擅長(cháng)的AI算力調度平臺,這與原來(lái)的云調度平臺、IaaS一脈相承,這也恰恰是青云差異化的價(jià)值,同時(shí)也是其他企業(yè)所需要的。”林源還強調,不少AI應用的行業(yè)模型調優(yōu)才剛剛開(kāi)始,“現在訓練都是裸金屬,很簡(jiǎn)單粗暴。未來(lái)一定不是這種方式,而會(huì )是云化的、池化的。所以這才剛剛開(kāi)始,AI Cloud一定是未來(lái)支撐這種應用最主流的方式。”