
這是繼天翼云在中文語(yǔ)言理解零樣本學(xué)習權威榜單ZeroCLUE拔得頭籌之后,獲得的又一重要獎項,進(jìn)一步夯實(shí)了天翼云AI在認知智能領(lǐng)域的行業(yè)領(lǐng)先地位。
ACL是全球影響力最大、最具活力的國際學(xué)術(shù)組織之一,是自然語(yǔ)言處理與計算語(yǔ)言學(xué)領(lǐng)域最具權威性的專(zhuān)業(yè)學(xué)會(huì )。ACL會(huì )議是NLP領(lǐng)域頂級會(huì )議,同時(shí)也是CCF 推薦的A類(lèi)國際學(xué)術(shù)會(huì )議。而本次WASSA混合語(yǔ)種競賽吸引了來(lái)自全球的58個(gè)優(yōu)秀團隊參與。

WASSA 2023成績(jì)排名
情感是人類(lèi)基本的心理經(jīng)驗之一,且難以被定義。在不同語(yǔ)種情境下,人類(lèi)識別文本的各類(lèi)情感具有一定難度,而將這些知識轉移到機器上,用機器識別混合語(yǔ)種(code mixed)文本中蘊含的情感將更具挑戰性。WASSA 2023中的混合語(yǔ)種賽事便是針對混合語(yǔ)種文本多標簽情感分類(lèi)(MLEC)和多類(lèi)別情感分類(lèi)(MCEC)舉辦的競賽。混合語(yǔ)種的每個(gè)樣本中包含憤怒、喜悅、熱愛(ài)等12類(lèi)情感中的一類(lèi)或多類(lèi),參賽者需要盡可能準確地識別各文本樣本中蘊含的情感。 本次競賽中,天翼云AI團隊的算法重點(diǎn)采用了“提示學(xué)習”(Prompt Learning)技術(shù)。“提示學(xué)習”是大模型研究的前沿技術(shù)之一,也被稱(chēng)為自然語(yǔ)言處理領(lǐng)域的“第四范式”。傳統“預訓練+微調”的NLP模型應用方式不僅會(huì )消耗大量的計算、存儲資源,也會(huì )浪費預訓練模型的泛化能力。應用“提示學(xué)習”技術(shù),則可以通過(guò)設計不同的提示詞、無(wú)需進(jìn)行模型微調,就能進(jìn)行下游任務(wù)的適配和部署,這一方式實(shí)現了預訓練模型的高效利用,同時(shí)保留了模型的泛化能力。

模型微調與提示學(xué)習的對比
天翼云AI團隊的算法方案僅使用單張GPU卡就實(shí)現了混合語(yǔ)種情感分類(lèi)任務(wù)的適配和推理,方案中的數據預處理、提示詞設計、數據推理全流程可在數小時(shí)內完成。利用少量的算力和存儲資源,算法方案就能高效部署到下游任務(wù)中,這體現了天翼云AI團隊在大模型、認知智能領(lǐng)域的技術(shù)沉淀,以及對相關(guān)業(yè)務(wù)場(chǎng)景的深度理解。
目前,天翼云AI團隊“提示學(xué)習”技術(shù)已在實(shí)際業(yè)務(wù)中得到廣泛應用,尤其是“大模型+提示學(xué)習”的技術(shù)范式有效地將大模型的能力應用到下游各類(lèi)任務(wù)和業(yè)務(wù)場(chǎng)景中。未來(lái),天翼云將繼續推進(jìn)人工智能領(lǐng)域技術(shù)創(chuàng )新與突破,加快打造原創(chuàng )技術(shù)策源地,推動(dòng)數字技術(shù)與產(chǎn)業(yè)深度融合,賦能千行百業(yè)數字化轉型。