
當地時(shí)間周五,谷歌公司發(fā)布新的機器人模型Robotics Transformer 2(RT-2),搭載了大語(yǔ)言模型的最新進(jìn)展,且能幫助訓練機器人理解扔垃圾等任務(wù)。
RT-2是一種“視覺(jué)-語(yǔ)言-行動(dòng)”模型,可以通過(guò)在網(wǎng)絡(luò )上投喂信息和圖像,訓練機器人執行響應的動(dòng)作。這使得機器人變得更加聰明,并賦予它們新的理解和解決問(wèn)題的能力。
例如,如果希望以前的系統能夠扔掉垃圾,必須明確地訓練它們能夠識別垃圾,以及撿起并扔掉垃圾。RT-2則能夠從大量的網(wǎng)絡(luò )數據中轉移知識,它已經(jīng)知道什么是垃圾,并且可以在沒(méi)有明確訓練的情況下識別垃圾。
谷歌宣稱(chēng),相比以往第一個(gè)版本,新的模型讓機器人的性能幾乎翻倍,準確率從32%提升至62%。
谷歌DeepMind的機器人主管Vincent Vanhoucke說(shuō):“由于生成式AI的爆火,我們不得不重新考慮整個(gè)研究計劃。之前做的很多事情都已經(jīng)完全失效了。”
加州大學(xué)伯克利分校的機器人領(lǐng)域教授Ken Goldberg表示,機器人的靈巧程度仍達不到人類(lèi)的水平,在一些基本任務(wù)上也表現不佳,但谷歌利用人工智能語(yǔ)言模型賦予機器人新的推理和即興創(chuàng )作技能,這是一個(gè)有希望的突破。