Facebook發(fā)布高效能完全非監(jiān)督式語音辨識模型Wav2vec-U

　　Wav2vec-U是FacebookWav2vec語音辨識模型的非監(jiān)督式版本，完全不需要轉(zhuǎn)錄資料，也不用標(biāo)簽資料訓(xùn)練，效能已經(jīng)與2019年最佳監(jiān)督式語音辨識模型相當(dāng)

　　Facebook發(fā)表最新的語音辨識技術(shù)Wav2vec-U，這是Wav2vec非監(jiān)督式版本，可以讓研究人員不需要將語音轉(zhuǎn)錄成文字資料，就可以訓(xùn)練模型的方法，Wav2vec-U的效能已經(jīng)可媲美幾年前，使用1,000小時轉(zhuǎn)錄語音資料訓(xùn)練的監(jiān)督式模型。

　　無論是回答問題還是執(zhí)行請求，語音辨識技術(shù)已經(jīng)被廣泛地應(yīng)用在各種情境，但現(xiàn)今的語音辨識系統(tǒng)，僅對少數(shù)語言友善，研究人員解釋，這是因為需要大量的轉(zhuǎn)錄音頻，才能夠訓(xùn)練出高品質(zhì)的語音辨識系統(tǒng)，但是每種語言、方言或是說話方式并無法輕易的取得這樣的資料。

　　因此Facebook開發(fā)了Wav2vec-U，這是一種不需要轉(zhuǎn)錄資料的語音辨識系統(tǒng)方法，F(xiàn)acebook已經(jīng)在Swahili和Tatar等語言測試該模型，由於這些語言缺乏大量帶有標(biāo)簽的訓(xùn)練資料，因此一直沒有高品質(zhì)的語音辨識模型。

　　Wav2vec-U能純粹從錄制的語音音頻和未配對的文字中學(xué)習(xí)，過程不需要進(jìn)行任何轉(zhuǎn)錄的工作，與過去的自動語音辨識系統(tǒng)相比，F(xiàn)acebook采用了一種新方法，能夠從未標(biāo)記的音頻中學(xué)習(xí)語音結(jié)構(gòu)，結(jié)合Wav2vec-U和k-平均演算法，就能將語音分割出各個對應(yīng)的語音單元，像是把CAT這個詞分割成/K/、/AE/和/T/。

　　為了要學(xué)習(xí)辨識語音中的單詞，研究人員訓(xùn)練了由生成網(wǎng)絡(luò)（Generator）和判別網(wǎng)絡(luò)（Discriminator）組成的生成對抗網(wǎng)絡(luò)（GAN），其生成網(wǎng)絡(luò)使用嵌入在自我監(jiān)督表示中的每個音頻片段，并預(yù)測和語言中聲音相對符的音位（Phoneme），目的是要試圖欺騙判別網(wǎng)絡(luò)來進(jìn)行訓(xùn)練，判別網(wǎng)絡(luò)會評估預(yù)測的音位序列是否逼真。最初生成網(wǎng)絡(luò)產(chǎn)生的結(jié)果很差，但是經(jīng)過判別網(wǎng)絡(luò)的回饋，生成網(wǎng)絡(luò)產(chǎn)生的結(jié)果會更加準(zhǔn)確。

　　研究人員提到，判別網(wǎng)絡(luò)本身也是一個神經(jīng)網(wǎng)絡(luò)，透過將生成網(wǎng)絡(luò)的輸出當(dāng)做輸入，以及來自各種音元化的真實文本，能訓(xùn)練判別網(wǎng)絡(luò)學(xué)會區(qū)分由生成網(wǎng)絡(luò)產(chǎn)生的輸出和真實文本。

　　研究人員將Wav2vec-U與其他模型比較，以評估Wav2vec-U的效能，在TIMIT基準(zhǔn)測試中，與最佳的非監(jiān)督式方法相比，Wav2vec-U錯誤率降低57％，而在更大型的Librispeech基準(zhǔn)測試中，Wav2vec-U與基準(zhǔn)中歷年最佳效能的監(jiān)督式模型相比（下圖），Wav2vec-U在沒有任何轉(zhuǎn)錄資料訓(xùn)練下，和2019年使用960小時轉(zhuǎn)錄資料訓(xùn)練的模型效能不相上下。

　　TIMIT和Librispeech都是用來評估英文系統(tǒng)的基準(zhǔn)測試，但英文由於有大量的標(biāo)簽資料集，已經(jīng)存在極佳的語音辨識技術(shù)，而非監(jiān)督式語音辨識，將對於缺乏標(biāo)簽資料的語言，產(chǎn)生極大的影響。因此研究人員也開始在Swahili、Tatar和Kyrgyz等標(biāo)簽資源匱乏的語言中，研究使用Wav2vec-U。

　　Facebook提到，Wav2vec-U是他們在語音辨識、自我監(jiān)督學(xué)習(xí)和非監(jiān)督式機(jī)器翻譯上多年的成果，讓模型僅透過觀察就可以習(xí)得解決任務(wù)的能力，這項成果將使得語音技術(shù)為更多人所用。

97成人免费视频,97视频免费公开成人福利,免费视频99,99婷婷,国产伊人久久,亚洲视频欧美,国产精品福利久久

評論排行

推薦閱讀

專題

大家都在看

CTI論壇會員企業(yè)