如何讓機(jī)器學(xué)會(huì)保持一個(gè)完整的對(duì)話始終是人工智慧界最困難的問題之一。因?yàn)槿粝肓私庖痪湓捇蛞欢挝淖值恼嬲饬x,機(jī)器(甚至人)需要對(duì)世界有一定程度的理解,它們需要「常識(shí)」。
如今,為了解決這一難題,Salesforce公司的研究人員們想出了一個(gè)妙招:在教一個(gè)演算法其他技能之前,先教它說第二種語(yǔ)言。

他們發(fā)現(xiàn),當(dāng)一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)學(xué)會(huì)如何把一種語(yǔ)言翻譯成另外一種語(yǔ)言時(shí),它會(huì)自動(dòng)學(xué)會(huì)單詞之間的關(guān)系。而若以這個(gè)系統(tǒng)為基礎(chǔ),再訓(xùn)練另外一個(gè)應(yīng)用時(shí)(比如對(duì)話,或察覺文字中的情緒),它的表現(xiàn)將遠(yuǎn)好于從零建立的系統(tǒng)。
Salesforce的首席科學(xué)家、機(jī)器學(xué)習(xí)專家Richard Socher對(duì)此表示:「我們所做的基本上就是把機(jī)器翻譯的數(shù)據(jù)拿來,去教一個(gè)模型如何理解單詞和情境。」
有很多「機(jī)器學(xué)習(xí)的創(chuàng)新」可以用來提高機(jī)器人的語(yǔ)言能力,Salesforce的研究成果只是其中之一。正如許多基于深度學(xué)習(xí)的計(jì)算機(jī)視覺系統(tǒng)都會(huì)提前接受網(wǎng)路訓(xùn)練,Socher認(rèn)為,機(jī)器翻譯對(duì)自然語(yǔ)言系統(tǒng)的作用也是類似的。
作為一個(gè)集銷售、營(yíng)銷以及客戶互動(dòng)管理為一體的大型網(wǎng)路平臺(tái),Salesforce已經(jīng)在其Einstein平臺(tái)中提供一系列的人工智慧工具。比如,一個(gè)可以對(duì)電郵和訊息中的情緒進(jìn)行自動(dòng)分類的工具,以及一個(gè)根據(jù)員工之前的工作,自動(dòng)對(duì)他需要追查的線索進(jìn)行優(yōu)化的工具。
Socher相信,他們這個(gè)發(fā)現(xiàn)將會(huì)提高Einstein平臺(tái)的自動(dòng)語(yǔ)言能力,「對(duì)于聊天機(jī)器人和自動(dòng)客服來說,它‘超級(jí)’有用。」
在測(cè)試中,研究人員首先需要訓(xùn)練一個(gè)深度學(xué)習(xí)系統(tǒng)在英語(yǔ)和德語(yǔ)之間進(jìn)行翻譯。為此,他們給一個(gè)多層神經(jīng)網(wǎng)路提供了大量已經(jīng)翻譯好的文件,并慢慢調(diào)試各種參數(shù),直至它可以自行產(chǎn)生不錯(cuò)的翻譯結(jié)果。
在學(xué)會(huì)翻譯之后,研究人員們就開始訓(xùn)練這個(gè)「雙語(yǔ)人工智慧」去學(xué)習(xí)更多的技能了,比如判斷一段文字背后的情緒,對(duì)各種問題進(jìn)行分類,以及回答問題。在對(duì)比測(cè)試中,經(jīng)過雙語(yǔ)訓(xùn)練的神經(jīng)網(wǎng)路的成績(jī)遠(yuǎn)好于沒有經(jīng)過雙語(yǔ)訓(xùn)練的系統(tǒng)。
由于機(jī)器翻譯已經(jīng)是一個(gè)成熟的領(lǐng)域,研究人員有大量的數(shù)據(jù)來進(jìn)行訓(xùn)練。「翻譯和語(yǔ)言的其他部分之間有著極其重要的關(guān)聯(lián),」Salesforce的研究員Bryan Mc Cann說道:「(翻譯數(shù)據(jù))一般涉及面非常廣,它們包含著各種對(duì)自動(dòng)語(yǔ)言處理有用的信息。」