語音技術(shù)——性別辨識(shí)和語者驗(yàn)證
2010/11/24
性別辨識(shí)和語者驗(yàn)證簡介
性別辨識(shí)(Gender Recognition)技術(shù)是以語音訊號(hào)處理的方法,擷取說話者的聲音特征,藉此判斷說話者的性別是男性或女性,如下流程圖所示的技術(shù)。
而語者驗(yàn)證(Speaker Verification)技術(shù),如下圖所示,我們亦可稱之為語者認(rèn)證(Speaker Authentication)或是語者偵測(Speaker Detection),主要是用來鑒定一已知身份的說話者其宣稱之身份的真實(shí)性,利用擷取說話者的聲紋特征,我們可以從事先儲(chǔ)存的語者聲紋資料庫中,取出該宣稱身份的語者聲紋模型,并且和說話者輸入的聲音做比對,由于系統(tǒng)會(huì)先獲知該使用者表明的身份(如小美),所以這會(huì)造成兩種可能的判斷錯(cuò)誤,其中一種是錯(cuò)誤接受(False Accept),即說話者為一冒充者(Imposter)但被系統(tǒng)誤認(rèn)為其所宣稱的身份,另外一種是錯(cuò)誤拒絕(False Reject),即系統(tǒng)將真實(shí)身份的說話者誤判為冒充者。
性別辨識(shí)和語者驗(yàn)證特色
本項(xiàng)性別辨識(shí)技術(shù)的主要特點(diǎn)在于用戶不須事先建立個(gè)人聲紋資料庫,祗要提供輸入的聲紋即可進(jìn)行辨識(shí),且辨識(shí)率在實(shí)際的電話語音中可達(dá)93%。
語者驗(yàn)證辨識(shí)技術(shù)的特色分為兩種,一種是和本文相關(guān)(Text-Dependent)的驗(yàn)證,即用戶在建立個(gè)人聲紋資料庫和驗(yàn)證個(gè)人聲紋所輸入聲音必須是相同的,另一種是和本文無關(guān)(Text-Independent)的驗(yàn)證,即用戶在建立個(gè)人聲紋資料庫和驗(yàn)證個(gè)人聲紋時(shí)所輸入的聲音允許是不同的,而本公司提供的技術(shù)同時(shí)可應(yīng)用于上述的兩種使用情境,讓使用者的應(yīng)用更廣泛。
性別辨識(shí)和語者驗(yàn)證應(yīng)用
性別辨識(shí)可應(yīng)用于需驗(yàn)證男女生性別的場合,例如從身份證號(hào)碼的第一個(gè)數(shù)字得知被驗(yàn)證者的性別,驗(yàn)證說話者的性別是否與該身份證號(hào)碼所載的性別一致,此外也可應(yīng)用在語音辨識(shí)的前端,當(dāng)辨識(shí)出說話者的性別后,以性別相關(guān)的語音模型(Gender-Dependent
Model)進(jìn)行辨認(rèn)以提升語音辨識(shí)率。
語者驗(yàn)證技術(shù)的應(yīng)用則更廣泛,在個(gè)人方面可應(yīng)用于個(gè)人設(shè)備的管控,例如:個(gè)人電腦的使用權(quán)限設(shè)定,在企業(yè)方面則有銀行信用卡刷卡時(shí)的身份核對,或從大量的客服人員對話資料中擷取出是否有含某特定身份者在說話,以減輕客服人員的工作量,并提升客服品質(zhì)(Quality
Management)。
CTI論壇編輯
臺(tái)達(dá)客服中心錄音質(zhì)檢系統(tǒng)解決方案 2010-11-19 |
報(bào)告稱語音識(shí)別每兩年的復(fù)合成長率為97.7% 2010-11-03 |
人機(jī)接口的發(fā)展演變路線圖 2010-11-02 |
臺(tái)達(dá)語音識(shí)別系統(tǒng)Delta Recognizer V5.0 2010-11-01 |
臺(tái)達(dá)電子鄭漢彬:語音識(shí)別于呼叫中心的創(chuàng)新應(yīng)用 2010-05-24 |