
為什么要開(kāi)放高質(zhì)量網(wǎng)智數據集
通信網(wǎng)絡(luò )是數字經(jīng)濟發(fā)展的基石,提升通信網(wǎng)絡(luò )的智能化水平,建設高度數字化、智能化的自智網(wǎng)絡(luò )是不僅是當前ICT產(chǎn)業(yè)技術(shù)創(chuàng )新的熱點(diǎn)方向,更關(guān)系到數字經(jīng)濟的發(fā)展新動(dòng)能。長(cháng)期以來(lái),通信行業(yè)缺少具備行業(yè)影響力、公信力的通信網(wǎng)絡(luò )公開(kāi)數據集,尤其是有現網(wǎng)特色的真實(shí)、多樣的規模性數據,制約著(zhù)網(wǎng)絡(luò )智能化關(guān)鍵技術(shù)的發(fā)展與突破,業(yè)界對高質(zhì)量數據集需求迫切。
首批開(kāi)放的數據集覆蓋多種場(chǎng)景
首批開(kāi)放的7個(gè)網(wǎng)智精品數據集,來(lái)自于移動(dòng)現網(wǎng)不同領(lǐng)域的生產(chǎn)創(chuàng )新需求,經(jīng)過(guò)數據清洗及治理,總數據量達到上億,已經(jīng)在中國移動(dòng)一線(xiàn)維護、優(yōu)化、服務(wù)保障等領(lǐng)域的生產(chǎn)實(shí)踐中經(jīng)過(guò)了充分驗證,具有現網(wǎng)真實(shí)性、多樣性、數量多、種類(lèi)全,覆蓋廣的特點(diǎn),涵蓋網(wǎng)絡(luò )智能感知、預測、診斷、決策等多項能力場(chǎng)景,能夠為網(wǎng)絡(luò )智能化創(chuàng )新能力研發(fā)孵化提供數據基礎。數據集詳情如下:
CSI壓縮反饋:復雜信道環(huán)境的無(wú)線(xiàn)信道狀態(tài)信息數據及實(shí)測數據集,數據量級達到60萬(wàn)條。該數據集可用于訓練CSI壓縮反饋等網(wǎng)元智能模型,壓縮UE側的信道特征信息,并實(shí)現信道狀態(tài)信息的無(wú)損還原, 實(shí)現快速準確的CSI壓縮反饋能力, 提升反饋精度、降低反饋開(kāi)銷(xiāo)。
光網(wǎng)絡(luò )啞資源合規檢測:2萬(wàn)張光交箱、通信桿、光纜等五類(lèi)場(chǎng)景圖片數據集,該數據集可用于訓練網(wǎng)絡(luò )視覺(jué)模型,對傳輸線(xiàn)路中可能存在的啞資源進(jìn)行檢測和識別,打造安全可靠、穩定運行的光纖傳輸網(wǎng)絡(luò )。
無(wú)線(xiàn)側故障根因分析:現網(wǎng)豐富的無(wú)線(xiàn)網(wǎng)絡(luò )運維告警數據和故障工單數據,涵蓋130類(lèi)告警及23類(lèi)故障原因,數據量級達到460萬(wàn)條。該數據集可用于訓練故障根因分析模型,高效快速地定位故障問(wèn)題,從而 減少實(shí)際派單數量,優(yōu)化派單策略,節約人工成本。
無(wú)線(xiàn)鏈路質(zhì)量預測:5G 多樣化業(yè)務(wù)應用場(chǎng)景下2萬(wàn)條高精度時(shí)間分辨率下的無(wú)線(xiàn)網(wǎng)絡(luò )狀態(tài)參數及相應用戶(hù)業(yè)務(wù)下行速率信息數據,該數據集可用于訓練無(wú)線(xiàn)鏈路質(zhì)量預測模型,預測用戶(hù)業(yè)務(wù)下行速率,實(shí)現無(wú)線(xiàn)鏈路狀態(tài)實(shí)時(shí)感知,提升用戶(hù)視頻業(yè)務(wù)體驗和無(wú)線(xiàn)網(wǎng)絡(luò )服務(wù)能力,達到網(wǎng)絡(luò )和業(yè)務(wù)協(xié)同的用戶(hù)體驗跨層智能優(yōu)化。
無(wú)線(xiàn)小區多指標時(shí)空序列預測:無(wú)線(xiàn)通信場(chǎng)景下現網(wǎng)長(cháng)時(shí)間(2個(gè)月)、大規模(萬(wàn)量級)移動(dòng)通信小區歷史序列數據,數據量級達到億條,涵蓋流量、用戶(hù)數等重要指標及多維度小區屬性信息,該數據集可用于訓練時(shí)空聯(lián)合序列預測模型,預測 多項小區性能指標的演變趨勢, 從而為網(wǎng)絡(luò )規劃和維護工作制定更精準智能的優(yōu)化策略。
算網(wǎng)異常檢測及故障定位:算力網(wǎng)絡(luò )環(huán)境下網(wǎng)絡(luò )云化設備運行日志數據,包含154類(lèi)異常標注,數據量級達到60萬(wàn) 條。該數據集可用于建立有效的云網(wǎng)異常檢測模型和根因分析算法模型,實(shí)現快速準確的云設備故障檢測并定位故障原因,提升網(wǎng)絡(luò )運維效率。
網(wǎng)絡(luò )拓撲優(yōu)化:面對現網(wǎng)環(huán)境拓撲負載不均衡的挑戰,現網(wǎng)10萬(wàn)條網(wǎng)絡(luò )拓撲連接關(guān)系和網(wǎng)元屬性數據,該數據集可用于建立智能網(wǎng)絡(luò )優(yōu)化模型 ,探索網(wǎng)元流量的變化規律,并據此對網(wǎng)絡(luò )拓撲結構進(jìn)行動(dòng)態(tài)優(yōu)化,實(shí)現網(wǎng)絡(luò )負載均衡,提高網(wǎng)絡(luò )的性能和可靠性。
數據集的發(fā)布得到業(yè)界的高度認可
本次數據集的發(fā)布得到了中國移動(dòng)各級領(lǐng)導和相關(guān)部門(mén)的大力支持。
中國移動(dòng)集團公司副總工程師、集團級首席科學(xué)家王曉云表示:“高質(zhì)量數據是實(shí)現人工智能高質(zhì)量發(fā)展的核心要素。中國移動(dòng)傾力構建的這批網(wǎng)絡(luò )精品數據集,瞄準的是解決網(wǎng)絡(luò )智能化領(lǐng)域長(cháng)期數據資源不足、技術(shù)創(chuàng )新路徑受限的產(chǎn)業(yè)難題。相信中國移動(dòng)的貢獻,一定能夠為我國人工智能,特別是網(wǎng)絡(luò )智能化領(lǐng)域的技術(shù)研究、產(chǎn)品研發(fā)、人才培養、生態(tài)建設帶來(lái)全新動(dòng)能。”
中國移動(dòng)集團公司技術(shù)部總經(jīng)理陳洪濤表示:“本次開(kāi)放的7項網(wǎng)絡(luò )數據集,覆蓋了多領(lǐng)域的網(wǎng)元、運維、服務(wù)智能場(chǎng)景,具有很強的移動(dòng)通信行業(yè)特色和應用價(jià)值,這也是中國移動(dòng)建設“智慧網(wǎng)絡(luò )國家新一代人工智能開(kāi)放創(chuàng )新平臺”的重要舉措之一,后續中國移動(dòng)將持續發(fā)揮自身優(yōu)勢,為產(chǎn)業(yè)開(kāi)放更多的創(chuàng )新資源,更好的促進(jìn)我國通信+AI技術(shù)的融合創(chuàng )新與突破。”
中國移動(dòng)研究院院長(cháng)黃宇紅表示:“中國移動(dòng)構建的網(wǎng)絡(luò )數據集,既著(zhù)眼當下又面向未來(lái),不僅能夠助力現網(wǎng)運維優(yōu)化等領(lǐng)域的人工智能算法創(chuàng )新,也能服務(wù)下一代網(wǎng)絡(luò )的前沿技術(shù)研究、方案驗證、模擬仿真和標準化等。中國移動(dòng)期待能基于數據集的建設和不斷發(fā)展,與產(chǎn)學(xué)研各界勇闖網(wǎng)絡(luò )新技術(shù)無(wú)人區,共同構建我國信息通信技術(shù)新優(yōu)勢!”
中國移動(dòng)集團級首席科學(xué)家,研究院人工智能與智慧運營(yíng)中心總經(jīng)理馮俊蘭表示:“中國移動(dòng)正在構建業(yè)界領(lǐng)先的網(wǎng)絡(luò )大模型,深刻感受到高質(zhì)量數據的重要意義,也深知數據集的開(kāi)放共享對于產(chǎn)業(yè)的巨大價(jià)值。我們希望以本次數據集的建設和發(fā)布為新的起點(diǎn),能在網(wǎng)絡(luò )智能化技術(shù)創(chuàng )新方面匯聚更多的產(chǎn)業(yè)力量,攜手攻克智慧網(wǎng)絡(luò )的科學(xué)難題,共同實(shí)現通信網(wǎng)絡(luò )AI+X的發(fā)展新范式。”
中國移動(dòng)集團公司網(wǎng)絡(luò )事業(yè)部副總經(jīng)理顧寧倫表示:“中國移動(dòng)充分發(fā)揮自智網(wǎng)絡(luò )子鏈的產(chǎn)業(yè)帶動(dòng)作用,依托現網(wǎng)豐富多樣的數據優(yōu)勢,挖掘網(wǎng)絡(luò )智能化痛點(diǎn)問(wèn)題和生產(chǎn)需求,體系化構建多領(lǐng)域、大規模的移動(dòng)網(wǎng)絡(luò )特色數據集。相信本次發(fā)布的數據集能夠有效助力網(wǎng)絡(luò )智能感知、診斷、預測、決策等領(lǐng)域的技術(shù)創(chuàng )新,助力我國自智網(wǎng)絡(luò )加快演進(jìn)升級。”
同時(shí),業(yè)界專(zhuān)家對本次數據集的發(fā)布也給予了高度關(guān)注和充分肯定。
北京郵電大學(xué)理學(xué)院副院長(cháng)、北京郵電大學(xué)-中國移動(dòng)研究院聯(lián)合創(chuàng )新中心主任張建華教授表示:“展望6G,將是通感算智深度融合的移動(dòng)通信信息網(wǎng)絡(luò )。全面、海量、精確的通信網(wǎng)絡(luò )數據集,是6G技術(shù)研究和產(chǎn)業(yè)發(fā)展的亟需。我們期待并相信中國移動(dòng)網(wǎng)智數據集的開(kāi)放將為6G與 AI的深度融合技術(shù)創(chuàng )新提供寶貴的數據要素。北郵與中國移動(dòng)研究院成立聯(lián)合創(chuàng )新中心以來(lái),在6G信道測量平臺與數據集共建方面取得了豐碩成果,共同發(fā)布了面向6G AI空口的信道數據集。今后我們將繼續深化合作,持續建設發(fā)布優(yōu)質(zhì)數據集,服務(wù)產(chǎn)業(yè)發(fā)展需要。”
新華三集團行業(yè)事業(yè)部副總裁、移動(dòng)系統部總經(jīng)理王棟良表示:“在新一輪的產(chǎn)業(yè)變革中,人工智能正在釋放科技革命和產(chǎn)業(yè)革新的巨大能量。而數據,則是這股能量的關(guān)鍵源泉。自2021年開(kāi)始,新華三便開(kāi)始建設AI數據集,我們堅信,只有充分挖掘數據的潛力,才能推動(dòng)算法不斷升級,加速產(chǎn)業(yè)突破。新華三積極支持移動(dòng)研究院數據資源開(kāi)放共享的建設,提供了大量AI數據集,充分挖掘數據集潛力,期待與大家攜手共同推動(dòng)數據集的落地,助力數字產(chǎn)業(yè)發(fā)展變革。
未來(lái),中國移動(dòng)將依托“智慧網(wǎng)絡(luò )國家新一代人工智能開(kāi)放創(chuàng )新平臺”,建設并開(kāi)放更多優(yōu)質(zhì)網(wǎng)智數據集,為我國通信領(lǐng)域智能化技術(shù)突破、產(chǎn)業(yè)發(fā)展和通信+AI復合型人才的培養做出更大的貢獻。